יצירה אוטומטית של קישורים על תוכן אוטומטי
הפוסט הבא מיועד למי שעוסק בקידום אתרים מהצד הלא נחמד שלו.
בוורדקמפ הבא (כנס וורדפרס הישראלי) יתכן שתהיה הרצאה או פאנל על יצירה של תוכן אוטומטי, הכוונה היא בוודאי איך ליצור אתר (בלוג) ששואב תכנים ב-RSS ממקורות שונים ומציג אותו בבלוג וכל זה באופן אוטומטי.
כתבתי בעבר על הנושא פוסט מאד מפורט, דברים שאפשר לעשות עם RSS ופירטתי אפשרויות, רכיבים וסקריפטים שונים שיכולים לבצע את העבודה עבור משיכה והצגה של תוכן אוטומטי.
קצת קשה לי לדמיין שימושים הגונים עבור בלוג ששואב תכנים ממקורות באינטרנט ואני מניח שרוב השימושים הם לטובת קידום. לכן, כדי להמשיך את קו המחשבה של הפוסט הקודם ולהעשיר את ההרצאות העתידיות בוורדקמפ בכל הנוגע לרשע, הנה עוד רעיון שימושי למה שניתן לעשות עם תוכן אוטומטי:
אז כאמור שאבנו RSS לתוך בלוג ונוצר אתר שמתעדכן אוטומטית בתכנים. אפשר לשלב באתר כזה פרסומות Adsense ולקוות שגוגל יסרוק אותו ויביא אליו גולשים שילחצו על הפרסומות.
כאשר יש לנו תוכן ותנועה של גולשים, כדאי יהיה להפוך חלק מהמילים לקישורים, בשביל קידום, בשביל להביא תנועה לאתר מסוים או בשביל אפיליאט.
את אותם הפידים של RSS ששואבים לבלוג ניתן להעביר באמצעות Yahoo Pipes. אפליקציה זו מאפשרת לבצע מניפולציות על התוכן של ה-RSS.
למשל, ניתן לתרגם את התוכן משפה אחת לשפה אחרת כלומר, לשאוב פיד בצרפתית ולתרגם אותו לאנגלית וליצור אתר עם תוכן אוטומטי שגוגל לא יזהה כמשוכפל. אמנם התוכן יהיה בוודאי מוזר תחבירית, אבל תוכן זה תוכן.
כמו כן, ניתן לבצע החלפה על מילים, כלומר את כל ההופעות של הביטוי "הרחקת יונים" להחליף ל"סילוק יונים".
אם נחזור לרעיון של יצירה אוטומית של לינקים על כל ביטוי מסויים שמופיע בתוכן, ניתן גם לבצע מניפולציה על כל התכנים שנשאבים, להחליף מילה באותה המילה רק שהפעם לדחוף לה גם קוד HTML, כלומר להוסיף עליה קישור. כך, ניתן לקבוע שכל פעם שמופיעה המילה "בניית אתרים" היא תהפוך לקישור ותקשר אל אתר מסוים.
יש להוסיף על הפיד, אלמנט מסוג Loop ובתוכו להוסיף אלמנט של String Replace, שם לקבוע כי עבור כל item.description, יש להחליף את המילה בקוד HTML שמוסיף קישור על המילה.
כך ניתן ליצור קישורים אוטומטיים על תוכן אוטומטי. פשוט, קל ומרושע.
מרושע הולם אותך
Good post for Mr. Shloman that is really into that kind of content stealing.
באמת מרושע
לא מרושע בכלל, די פאסה אפילו.
מומלץ להשתמש בטקסט שיצא מאיזה אלגוריתם של מרקוב
סתם הערה קטנה, יש לא מעט שימושים לא ממש "מזעזעים" ל"שאיבת" תוכן ופרסום אוטומטי.
הדוגמאות המתבקשות הן הפלאנט שרן יצר בזמנו לוורדפרס בעברית או אגרגטורים שונים.
(נכון ששתי הדוגמאות הן סוג של קידום אתרים, אבל הוא באמת לא מהסוג המרושע)
ואחלה פוסט.
חוצמזה מרושע זה מצויין
מסכים עם חנית ועם רוח התגובות: לא כל אמצעי מרמז על כוונה, ולא כל כוונה באה לכדי מימושה.
ומההיבט היותר מקצועי: בשוק ה-SEO בעברית, יש לא מעט אנשים הגונים, שמחליפים את כובעיהם עם רדת החשיכה. ואני רחוק מלשפוט אותם.
מה שלוף אמר.
הרבה יותר מעניין מסתם אגרגציה זה יצירת תוכן אוטומטי ממש. מרקוב וכו'. אולי מרושע מעניין.
(וכנראה שלשם אנחנו הולכים וחלק מעתיד הרשת נמצא שם, נרצה או לא נרצה).
על איזה תוסף לוורדפרס שיציג RSS באתר אתם ממליצים ?
@אורן
מה מעניין בזה? דימה דובין לא ממש מבין SEO (תראה לדוגמא את האתר sababafx.com)
אני ממליץ לך לשנן את המאמר הזה
http://seodummy.blogspot.com/2006/04/do-automatic-content-generators-work.html
מיכאל –
קודם כל תודה על הלינק. מעניין. שיננתי.
אני לא יודע מי זה דימה ולא אם הוא הוא מבין בSEO או לא, אבל:
1. SEO זה לא חזות הכל.
2. שרשראות מרקוב זו רק נקודת פתיחה, ובכל אופן – אפשר להתבסס על שרשראות של אותיות, של מילים, של POS או על קומבינציות שלהם ולהוסיף עוד כל מיני פיצ'רים. יש מסמכים בכלל לא רעים שמבוססים על שרשראות מרקוב.
לגופו של עניין – ההתפלגות ההתחלתית ממנה נלמדות המחרוזות היא חשובה מאין כמוה ויכולה לשנות את התוצאות באופן מהותי. אף אחד (אף אחד!) לא מסיק את ההסתברויות של השרשראות מהשכיחויות במסמך אחד (אותו אח"כ "יוצרים" מחדש) כי אין לזה שום משמעות סטטיסטית. ההסתברויות אמורות להיות נלמדות מקורפוסים הרבה יותר גדולים. תכתוב סקריפט קטן, תריך על קורפוסים בגודל משתנה ותראה איל התוצאות משתפרות ככל שהקורפוס גדול יותר (ועדייןן ממוקד).
ועוד יותר לגופו – גם שבדה עצמו מודה שהניסוי שלו היה די מוגבל. (הוא בעייתי מעוד כמה בחינות, כמו, למשל הבדיקה האם העמוד קיבל לינקים נכנסים. אבל זה לא המקום.).
יצירה אוטומטית (בניגוד לשאיבה) היא מעניינת גם קוגניטיבית/מדעי המחשב וגם כי זו תופעה שנצטרך להתמודד איתה ברמת התוכן או ברמת הרעש.
ובכל אופן – הנה שאלה למומחי הSEO – לבלוג שלי היה PR של 5 (או 6) במשך תקופה ארוכה ואז לפתע צנח ל 2 ואחרי כחודש עלה ל3. מישהו?!
כל כלי שיכול לשמש למטרות לא "נחמדות" יכול בקלות לשמש ככלי עזר לאדם, כל תוכנה או מערכת לא ניתן להגדיר את המהות שלה ללא שימוש מסויים שהוא בעצם קובע אם השימוש הוא "טוב" או "רע" וזו צריכה להיות ההתייחסות לשאיבת תוכן או מידע והצגתו.
מיכאל יקר, סבבה פורקס מעולם לא קודם(או עודכן כבר כמה שנים), זה אתר פרטי לצורך לימוד ואני לא מבין מה הקשר שלו ל SEO.
את האתרים שאני מקדם (בחו"ל, כחלק מצוות) – אני לא מציג לאף אחד
אם אתה לא יודע מה מעניין ביצירת תוכן אוטומטי (בעזרת אלגוריתם מרקוב לדוגמה) – זה כנראה לא בשבילך.
אגב – מי אתה?
@יואב – תבדוק את התוסף הבא:
http://wordpress.org/extend/plugins/wp-o-matic/
אכן רעיון מגניב אך הטכניקה הזו מוכרת היטב בעולם הבלאקהאט כבר הרבה זמן. כיום גוגל (לא הישראלי) יודע לזהות דברים המסוג הזה שדי בעייתיים בגלל שכפול התוכן.
לרוב שכפול תוכן מזוהה ישר ומופעל עליו פילטר שמונע את הצגתו ב-SERPS (כמובן שיש מקרים יוצאים מן הכלל). כך יוצא שהאתר לא ישיג הרבה טרפיק ולכן האדסנס שבו לא יהיה ממש אפקטיבי. אז כפי שאמרת אפשר לפתור את זה באמצעות פונקציה שתתרגם ידנית לשפה אחרת (או לעשות את זה דרך הפייפ אוטומטית), אבל אז יש בעיה אחרת: בד"כ טקסט לא רלוונטי (והוא לא יוצא רלוונטי כי מדובר בתרגום מכונה), גורם לנטישה מהירה של האתר מצד המשתמש וכך משפיע על ה- bounce rate. ברגע שמזוהה נטישה מהירה באופן עקבי זה גורר פילטור.
גם אם תעבור על התוכן ידנית אחר כך ותהפוך אותו לקריא, גוגל מזהה תרגום שמתבצע פעם אחת. אפשר לעקוף את זה בקלות ע"י שימוש בתרגום לשפה נוספת בדרך ולבסוף הפעלת אלגוריתם מארקוב על הפלט, אבל עדיין נשארנו עם בעיית הנטישה.
כתבתי לאחרונה פוסט בו הצגתי שיטת black hat דומה בה היה שימוש בתוכן לא קשור נושאית בכלל לתוכן האתר:
http://www.askpavel.co.il/blog/google-machine
@אורן
תודה על ההסבר, בהחלט מקובל: תחום עיבוד השפה הטבעית רק ימשיך לצבור תאוצה.
לגבי ה-PR של הבלוג שלך, יכולות להיות לכך שתי סיבות אפשריות:
- הוספת הקישורים מתוך הבלוג החוצה \ הורדת הקישורים אל הבלוג מבחוץ בין עידכון לעידכון
- הצגת PR מטעה ע"י גוגל, ללא השפעה על המיקום ב-SERP (בין היתר, בכדי למנוע סחר בקישורים)
@luf
זה ברור, שאם מישהו חושב על משהו שזה לא מעניין – זה כנראה לא בשבילו (אמירה סתמית)
מי אני? יזם אינטרנט, מתלמידיו של פרופ' שיזף רפאלי
@פבל
אתה צודק, ועדיין השימוש בטקסט מעובד-מכונה הוא נפוץ – בעיקר באתרי תמיכה – לטווח קצר. אף אחד לא אמר ש-BH SEO אין לו זכות קיום (את המנטרה הזאת תשמע בד"כ מ"מקדמי אתרים מוסמכים" של ה"מומחה קידום אתרים")
מצד אחד יכול להיות שיש צדק בדבריך ומצד שני יכול להיות שגם לא ואני אפרט :
מדוע גוגל לא מתייחס לזה וזורק אתרים אחורה ? אם כל אתר שמקפיד לתת מידע בכל דרך שהיא וגם אם זה בצורה כזו או דומה לזו שאתה מציג ,כל האתרים ברשת כבר היו ממוקמים באיזשהו מקום שלא ניראה לעין , למרות שאתה נוגע בנקודה מעניינת ותמיד ומומלץ מאוד לעשות זאת בדרכים הלבנות – שכמו כן הגולשים מגיעים בדיוק לאן שרצו ולא דרך תחכום של אחד ממקדמי האתרים בדרכים שחורות – גם אני הייתי קצת מתצבן אם אני מחפש מידע כלשהו בשפה כלשהי ומגיע למקום אחר ושפה זרה.
לפעמים הדרך הקשה ביא הגרך הקלה.
עדיף להתקדם לאט עם תוכן איכותי מאשר להתקדם מהר בצורה לא חוקית ואפילו עם " עבדנו " על גוגל
כתבה יפה ביותר, ידעתי שניתן לשאוב תכנים לאתר אבל לתרגם אותם וכך למנוע שכפול תוכן זה באמת יפה!..
כיום השיטה כבר אינה כל כך מוצלחת לאחר שינוי פנדה של גוגל, מתברר שהתוכן אינו כל כך מלך…