פרסומת
האם אתה מאמין ברעיון שברגע שמשהו מתפרסם באינטרנט הוא מתפרסם לנצח? ובכן, היום אנו נפיץ את המיתוס הזה.
האמת היא שבמקרים רבים אפשר בהחלט למגר מידע מהאינטרנט. בטח, יש תיעוד של דפי אינטרנט שנמחקו אם אתה מחפש באתר מכונת Wayback, ימין? כן, בהחלט. במכונת ה- Wayback יש רשומות של דפי אינטרנט שחזרו שנים רבות אחורה - דפים שלא תמצאו בחיפוש בגוגל מכיוון שדף האינטרנט כבר לא קיים. מישהו מחק את זה, או שהאתר נסגר.
אז אין שום דרך לעקוף את זה, נכון? מידע ייחרק לנצח באבן האינטרנט, שם יש לדורות לראות? ובכן, לא בדיוק.
האמת היא שבעוד שיהיה קשה או בלתי אפשרי למחוק סיפורי חדשות מרכזיים שהתפשטו מאתר חדשות או בלוג אחד לאחרים כמו וירוס, זה די קל למגר לחלוטין דף אינטרנט או מספר דפי אינטרנט מכל רשומות הקיום - להסיר את הדף עבור שני מנועי החיפוש, כמו גם ה מכונת Wayback מכונת ה- Wayback החדשה מאפשרת לך לנסוע חזותית בזמן האינטרנטנראה כי מאז השקתו של מכשיר ה- Wayback בשנת 2001, בעלי האתר החליטו להשליך את הקו האחורי המבוסס על Alexa ולעצב אותו מחדש עם קוד קוד פתוח משלהם. לאחר עריכת בדיקות עם ... קרא עוד . יש כמובן תפס, אבל נגיע לזה.
3 דרכים להסרת דפי בלוגים מהאינטרנט
השיטה הראשונה היא זו שרוב בעלי אתרי האינטרנט משתמשים בה, מכיוון שהם לא יודעים טוב יותר - פשוט מחיקת דפי אינטרנט. זה יכול לקרות בגלל שהבנת שיש לך תוכן כפול באתר שלך, או בגלל שיש לך דף שאתה לא רוצה להציג בתוצאות חיפוש.
פשוט מחק את הדף
הבעיה במחיקת דפים לחלוטין מהאתר שלך היא שמכיוון שכבר הקמת את הדף באתר נטו, יש ככל הנראה קישורים מהאתר שלך כמו גם קישורים חיצוניים מאתרים אחרים לזה עמוד. כשאתה מוחק אותו, גוגל מזהה מייד את הדף שלך כדף חסר.
לכן, במחיקת הדף שלך לא רק יצרת בעיה עם שגיאות סריקה של "לא נמצא" עבור עצמך, אלא גם יצרת בעיה עבור כל מי שאי פעם קישור לדף. בדרך כלל משתמשים שמגיעים לאתר שלך מאחד מאותם קישורים חיצוניים יראו את הדף 404 שלך, שאינו בעיה מרכזית, אם אתה משתמש במשהו כמו קוד 404 המותאם אישית של גוגל כדי לתת למשתמשים הצעות מועילות או חלופות. אבל, אתה חושב שיכולות להיות דרכים חינניות יותר למחוק דפים מתוצאות חיפוש מבלי לבעוט את כל 404 האלו עבור קישורים נכנסים קיימים, נכון?
ובכן, יש.
הסר דף מתוצאות החיפוש של גוגל
ראשית כל, עליכם להבין שאם דף האינטרנט שברצונכם להסיר מתוצאות החיפוש של גוגל אינו עמוד מהאתר שלכם, אז יש לך מזל, אלא אם כן יש סיבות משפטיות או שהאתר פרסם את המידע האישי שלך באופן מקוון ללא שלך רשות. אם זה המקרה, השתמש ב- Google פותר בעיות ההסרה להגיש בקשה להסרת הדף מתוצאות החיפוש. אם יש לך תיק תקף, יתכן שתמצא הצלחה מסוימת לאחר הסרת הדף - כמובן שתצליח הצלחה אפילו יותר גדולה יצירת קשר עם בעל האתר כיצד להסיר מידע אישי כוזב באינטרנטפרטיות מקוונת אינה מובטחת יותר. למד כיצד לדווח על אתר ולהסיר מידע אישי מהאינטרנט. קרא עוד כפי שתיארתי איך לעשות ב -2009.
עכשיו, אם הדף שברצונך להסיר מתוצאות חיפוש נמצא באתר שלך, אתה במזל. כל שעליך לעשות הוא ליצור robots.txt הקלד וודא שאתה לא מותר לדף הספציפי שאתה לא רוצה בתוצאות החיפוש, או את כל הספרייה עם התוכן שאתה לא רוצה להוסיף לאינדקס. כך נראה חסימת עמוד בודד.
סוכן משתמש: * בטל: /my-deleted-article-th-i-want-removed.html
אתה יכול לחסום בוטים מסריקת ספריות שלמות של האתר שלך באופן הבא.
סוכן משתמש: * אל תאפשר: / תוכן-על-אישי-דברים /
לגוגל יש מעולה עמוד תמיכה שיכול לעזור לך ליצור קובץ robots.txt אם מעולם לא יצרת קובץ קודם. זה עובד טוב מאוד, כפי שהסברתי לאחרונה במאמר אודות מבנה עסקאות סינדיקציה כיצד לנהל משא ומתן על עסקאות סינדיקציה ולהגן על דירוג החיפוש שלךסינדיקציה היא כל הזעם בימינו. אך לפתע יכולת לגלות ששותף ההפצה רשום גבוה יותר ממך בתוצאות החיפוש אחר סיפור שכתבת במקור! הגן על דירוג החיפוש שלך. קרא עוד כדי שלא יפגעו בכם (בקשו משותפי הסינדיקציה לא לאפשר יצירת אינדקס של הדפים שלהם במקום בו אתם מוגדרים). ברגע ששותף הסינדיקציה שלי עצמו הסכים לעשות זאת, הדפים ששוכפלו בתוכן המשוכפל בבלוג שלי נעלמו לחלוטין מרשימות החיפוש.
רק האתר הראשי מופיע במקום השלישי עבור העמוד בו הם מפרטים את הכותרת שלנו, אך הבלוג שלי מופיע כעת במקום הראשון וגם בשני המקומות; משהו שהיה כמעט בלתי אפשרי אילו אתר בעל רשות גבוהה יותר היה משאיר את הדף המשוכפל לאינדקס.
מה שרבים לא מודעים לכך זה שאפשר להשיג זאת גם באמצעות ארכיון האינטרנט (מכונת ה- Wayback). להלן השורות שאתה צריך להוסיף לקובץ robots.txt שלך בכדי שזה יקרה.
משתמש-סוכן: ia_archiver. בטל: / מדגם-קטגוריה /
בדוגמה זו אני אומר לארכיון האינטרנט להסיר כל דבר בספריית המשנה של קטגוריית הדוגמאות באתר שלי ממכונת ה- Wayback. ארכיון האינטרנט מסביר כיצד לעשות זאת בדף העזרה של אי הכללה שלהם. כאן הם מסבירים כי "ארכיון האינטרנט אינו מעוניין להציע גישה לאתרי אינטרנט או למסמכי אינטרנט אחרים אשר מחבריהם אינם מעוניינים בחומרים שלהם באוסף."
זה עובר בניגוד לאמונה הרווחת כי כל דבר שפורסם באינטרנט נסחף לארכיון לנצח נצחים. Nope - מנהלי אתרים שבבעלותם התוכן יכולים להסיר את התוכן מהארכיון באופן ספציפי באמצעות גישת robots.txt.
הסר דף בודד עם תגי מטה
אם יש לך רק כמה דפים בודדים שברצונך להסיר מתוצאות החיפוש של Google, אתה למעשה לא צריך להשתמש בגישה robots.txt בכלל, אתה יכול פשוט להוסיף את המטא תג הנכון "רובוטים" לדפים האישיים, ולהגיד לרובוטים לא להוסיף לאינדקס או לעקוב אחר קישורים בכללותם עמוד.
אתה יכול להשתמש במטא "הרובוטים" שלמעלה כדי למנוע מהרובוטים להוסיף לאינדקס את הדף, או שאתה יכול לספר באופן ספציפי לרובוט של Google לא לאינדקס כך שהדף יוסר רק מתוצאות החיפוש של גוגל, ורובוטי חיפוש אחרים עדיין יכולים לגשת לדף תוכן.
זה תלוי בך איך תרצה לנהל את הרובוטים שעושים עם הדף והאם העמוד מופיע ברשימה או לא. עבור מספר דפים בודדים, זו יכולה להיות הגישה הטובה יותר. להסרת ספריית תוכן שלמה, עבור לשיטת robots.txt.
הרעיון של "הסרת" תוכן
סוג זה הופך את כל הרעיון של "מחיקת תוכן מהאינטרנט" על ראשו. טכנית, אם תסיר את כל הקישורים שלך לדף באתר שלך ותסיר אותם מחיפוש Google ומה- ארכיון האינטרנט בטכניקת robots.txt, הדף מיועד לכל דבר ועניין "למחוק" מהאינטרנט. הדבר המגניב הוא שאם יש קישורים קיימים לדף, הקישורים האלה עדיין יעבדו ולא תפעילו 404 שגיאות עבור אותם מבקרים.
זוהי גישה "עדינה" יותר להסרת תוכן מהאינטרנט מבלי לבלגן לחלוטין את הפופולריות הקיימת של האתר שלך ברחבי האינטרנט. בסופו של דבר, איך אתה הולך לנהל את התוכן שנאסף על ידי מנועי חיפוש וארכיון האינטרנט תלוי בך, אך תמיד זכור שלמרות מה שאנשים אומרים על אורך החיים של דברים שמתפרסמים ברשת, זה באמת נמצא בתוך שלך שליטה.
לראיין תואר ראשון בהנדסת חשמל. הוא עבד 13 שנה בהנדסת אוטומציה, 5 שנים בתחום ה- IT, וכעת הוא מהנדס אפליקציות. כעורך מנהל לשעבר של MakeUseOf, הוא דיבר בכנסים ארציים להמחשת נתונים והופיע בטלוויזיה וברדיו הארציים.