מנועי חיפוש כמו גוגל הם חלק ממה שהופך את האינטרנט לחזק כל כך. בכמה לחיצות מקשים ולחיצת כפתור מופיעות התשובות הרלוונטיות ביותר לשאלתך. אבל האם תהית פעם כיצד פועלים מנועי החיפוש? סורקי אינטרנט הם חלק מהתשובה.
אז מהו סורק אינטרנט וכיצד הוא פועל?
מהו סורק אינטרנט?
כשאתה מחפש משהו במנוע חיפוש, המנוע צריך לסרוק במהירות מיליוני (או מיליארדי) דפי אינטרנט כדי להציג את התוצאות הרלוונטיות ביותר. סורקי אינטרנט (המכונים גם עכבישים או בוטים למנועי חיפוש) הם תוכניות אוטומטיות ש"סורקות "את האינטרנט ומאספות מידע על דפי אינטרנט בצורה נגישה.
המילה "זחילה" מתייחסת לאופן בו סורקי אינטרנט חוצים את האינטרנט. סורקי אינטרנט ידועים גם בשם "עכבישים". השם הזה בא מהדרך שבה הם סורקים את האינטרנט - כמו איך עכבישים זוחלים ברשת קורי העכביש שלהם.
סורקי אינטרנט מעריכים ומרכיבים נתונים בכמה שיותר דפי אינטרנט. הם עושים זאת על מנת שהנתונים יהיו נגישים וניתנים לחיפוש, ומכאן שהם כה חשובים למנועי החיפוש.
חשוב על סורק אינטרנט כעורך העורך את האינדקס בסוף הספר. תפקיד האינדקס הוא ליידע את הקורא היכן בספר מופיע כל נושא או ביטוי מפתח. באופן דומה, סורק אינטרנט יוצר אינדקס שמנוע חיפוש משתמש בו כדי למצוא מידע רלוונטי על שאילתת חיפוש במהירות.
מהו אינדקס חיפוש?
כפי שהזכרנו, אינדקס חיפושים דומה להרכבת האינדקס בגב הספר. במובן מסוים, אינדקס חיפושים הוא כמו יצירת מפה פשוטה של האינטרנט. כאשר מישהו שואל מנוע חיפוש שאלה, מנוע החיפוש מריץ אותו דרך האינדקס שלו, והדפים הרלוונטיים ביותר מופיעים תחילה.
אבל איך מנוע החיפוש יודע אילו דפים רלוונטיים?
אינדקס החיפוש מתמקד בעיקר בשני דברים: הטקסט בדף והמטא נתונים של הדף. הטקסט הוא כל מה שאתה רואה כקורא, בעוד שהמטא נתונים הם מידע על קלט העמוד הזה על ידי יוצר הדף, המכונה "מטא תגים". תגי meta כוללים דברים כמו תיאור הדף וכותרת meta, המופיעים בחיפוש תוצאות.
מנועי חיפוש כמו Google יאנדקס את כל הטקסט בדף אינטרנט (למעט מילים מסוימות כמו "ה" ו- "a" במקרים מסוימים). לאחר מכן, כאשר מחפשים מונח לתוך מנוע החיפוש, הוא יחפש במהירות את האינדקס שלו אחר הדף הרלוונטי ביותר.
כיצד עובד סורק אינטרנט?
סורק אינטרנט פועל כפי שהשם מרמז. הם מתחילים בדף אינטרנט או בכתובת אתר ידועים ומכניסים לאינדקס כל דף בכתובת URL זו (לרוב, בעלי אתרים מבקשים מנועי חיפוש לסרוק כתובות אתרים מסוימות). כשהם נתקלים בהיפר-קישורים בדפים אלה, הם ירכיבו רשימת "לעשות" דפים שיסרוקו בהמשך. סורק האינטרנט ימשיך בכך ללא הגבלת זמן, בהתאם לכללים מסוימים לגבי אילו דפים יש לסרוק ומאיזה התעלמות.
סורקי אינטרנט אינם סורקים כל עמוד באינטרנט. למעשה ההערכה היא שרק 40-70% מהאינטרנט נוספו לאינדקס חיפושים (שהם עדיין מיליארדי דפים). סורקי אתרים רבים נועדו להתמקד בדפים הנחשבים ל"סמכותיים "יותר. מוּסמָך דפים מתאימים לקומץ קריטריונים שגורמים להם יותר סיכוי להכיל איכותיים או פופולריים מֵידָע. סורקי אינטרנט גם צריכים לחזור ולבקר בדפים באופן עקבי כאשר הם מתעדכנים, מוסרים או מועברים.
גורם אחרון השולט באילו דפים סורק אינטרנט יסרוק הוא פרוטוקול robots.txt או פרוטוקול אי הכללת רובוטים. שרת דף אינטרנט יארח קובץ robots.txt המפרט את הכללים עבור כל סורק אינטרנט או תוכניות אחרות שניגשות לדף. הקובץ יפסול סריקה של דפים מסוימים ואילו קישורים יוכל הסורק לבצע. מטרה אחת של קובץ robots.txt היא להגביל את העומס שהרובוטים גורמים לשרת האתר.
כדי למנוע מסורק אינטרנט לגשת לדפים מסוימים באתר שלך, תוכל להוסיף את התג "אסור" באמצעות קובץ robots.txt או להוסיף את noindex מטא תג לדף המדובר.
מה ההבדל בין זחילה לגרידה?
גירוד אתרים הוא שימוש בבוטים להורדת נתונים מאתר ללא אישור אתר זה. לעתים קרובות, גרידת אתרים משמשת מסיבות זדוניות. גירוד אתרים לוקח לעתים קרובות את כל קוד ה- HTML מאתרים ספציפיים, ומגרדים מתקדמים יותר יקחו גם את רכיבי CSS ו- JavaScript. כלים לגרידת אתרים ניתן להשתמש בהם כדי לאסוף במהירות ובקלות מידע על נושאים מסוימים (נניח, רשימת מוצרים) אך יכול גם לשוטט פנימה שטחים אפורים ובלתי חוקיים.
סריקת אינטרנט, לעומת זאת, היא אינדקס המידע באתרים באישור כך שיוכל להופיע בקלות במנועי החיפוש.
דוגמאות לסורק אתרים
לכל מנוע חיפוש גדול יש סורק אינטרנט אחד או יותר. לדוגמה:
- ל- Google יש Googlebot
- לבינג יש בינגבוט
- ל- DuckDuckGo יש DuckDuckBot.
למנועי חיפוש גדולים יותר כמו Google יש בוטים ספציפיים למוקדים שונים, כולל תמונות Googlebot, סרטוני Googlebot ו- AdsBot.
כיצד סריקה באינטרנט משפיעה על קידום אתרים?
אם אתה רוצה שהדף שלך יופיע בתוצאות מנועי החיפוש, הדף חייב להיות נגיש לסורקי אינטרנט. בהתאם לשרת האתר שלך, ייתכן שתרצה להקצות תדירות מסוימת של סריקה, אילו דפים לסרוק לסרוק, וכמה לחץ הם יכולים להפעיל על השרת שלך.
ביסודו של דבר, אתה רוצה שסורקי האינטרנט יתחדשו בדפים מלאים בתוכן, אך לא בדפים כמו הודעות תודה, דפי מנהל ותוצאות חיפוש פנימיות.
מידע בקצות אצבעותיך
השימוש במנועי חיפוש הפך לטבע השני עבור רובנו, אך לרובנו אין מושג כיצד הם פועלים. סורקי אתרים הם אחד החלקים העיקריים של מנוע חיפוש יעיל ואינדקס ביעילות מידע על מיליוני אתרים חשובים מדי יום. הם כלי בעל ערך רב לבעלי אתרים, מבקרים ומנועי חיפוש כאחד.
אתה עשוי לחשוב שמתכנתים ומפתחי אתרים עושים את אותה העבודה, אבל זה רחוק מהאמת. להלן ההבדלים העיקריים בין מתכנתים למפתחי אתרים.
קרא הבא
- הסבר על הטכנולוגיה
- חיפוש באינטרנט
- חיפוש בגוגל
- טריקים לחיפוש
ג'ייק הרפילד הוא סופר עצמאי הממוקם בפרת ', אוסטרליה. כשהוא לא כותב, הוא בדרך כלל בחוץ מצלם חיות בר מקומיות. אתה יכול לבקר אותו בכתובת www.jakeharfield.com
הירשם לניוזלטר שלנו
הצטרף לניוזלטר שלנו לקבלת טיפים, סקירות, ספרים אלקטרוניים בחינם ומבצעים בלעדיים!
לחצו כאן להרשמה