אינסטגרם הוא אחד מאתרי המדיה החברתית הפופולריים ביותר עם מיליארדי משתמשים. לכולם, מסטודנטים ועד סלבריטאים, יש חשבונות אינסטגרם. הנתונים הציבוריים מאינסטגרם יכולים להיות בעלי ערך עצום לעסקים, למשווקים ולאנשים פרטיים. כל אחד יכול להשתמש בנתונים האלה כדי לבצע ניתוח נתונים, שיווק יעד ויצירת תובנות.
אתה יכול להשתמש ב-Python כדי לבנות כלי אוטומטי המחלץ נתוני אינסטגרם.
התקנת ספריות נדרשות
Instaloader היא ספריית Python שבה תוכל להשתמש כדי לחלץ נתונים זמינים לציבור מאינסטגרם. אתה יכול לגשת לנתונים כמו תמונות, סרטונים, שם משתמש, לא. של פוסטים, ספירת עוקבים, ספירת עוקבים, ביוגרפיה וכו'. באמצעות Instaloader. שימו לב כי Instaloader אינו קשור, מורשה, מתוחזק או מאושר על ידי אינסטגרם בשום אופן.
כדי להתקין את instaloader באמצעות pip, הפעל את הפקודה הבאה:
צִפצוּף להתקין instaloader
אתה חייב שיהיה לך pip מותקן במערכת שלך להתקנת ספריות Python חיצוניות.
לאחר מכן, עליך להתקין את ספריית Pandas Python. Pandas היא ספריית Python המשמשת בעיקר לביצוע מניפולציות וניתוח נתונים. הפעל את הפקודה הבאה כדי להתקין אותה:
צִפצוּף להתקין פנדות
כעת, אתה מוכן להתחיל להגדיר את הקוד ולהביא את הנתונים מאינסטגרם.
הגדרת הקוד שלך
כדי להגדיר את כלי אחזור הנתונים של אינסטגרם, עליך לייבא את ספריית Instaloader Python וליצור מופע של המחלקה Instaloader. לאחר מכן, עליך לספק את ידית האינסטגרם של הפרופיל שממנו אתה רוצה לחלץ את הנתונים.
קוד ה-Instagram Extractor Python זמין ב-a מאגר GitHub והוא בחינם עבורך לשימוש תחת רישיון MIT.
יְבוּא instaloader
# יצירת מופע של מחלקת Instaloader
bot = instaloader. Instaloader()
# טעינת הפרופיל מנקודת אחיזה באינסטגרם
פרופיל = instaloader. Profile.from_username (bot.context, 'כריסטיאנו')
הדפס(פּרוֹפִיל)
זהו צעד ראשון טוב לבדוק את העבודה הבסיסית. אתה אמור לראות כמה נתונים משמעותיים ללא שגיאות:
חילוץ נתונים מפרופיל
אתה יכול לחלץ נתונים בעלי ערך זמין לציבור כמו שם משתמש, לא. של פוסטים, ספירת עוקבים, ספירת עוקבים, ביוגרפיה, מזהה משתמש וכתובת אתר חיצונית באמצעות Instaloader עם מספר שורות קוד בלבד. אתה רק צריך לספק את הידית האינסטגרם של הפרופיל.
יְבוּא instaloader
יְבוּא פנדות כפי ש pd# יצירת מופע של מחלקת Instaloader
bot = instaloader. Instaloader()
# טעינת פרופיל מנקודת אחיזה באינסטגרם
פרופיל = instaloader. Profile.from_username (bot.context, 'ליאו מסי')
הדפס("שם משתמש: ", profile.username)
הדפס("זהות המשתמש: ", profile.userid)
הדפס("מספר פוסטים: ", profile.mediacount)
הדפס("ספירת עוקבים: ", profile.followers)
הדפס("הספירה הבאה: ", profile.followees)
הדפס("ביוגרפיה: ", profile.biography)
הדפס("כתובת אתר חיצונית: ", profile.external_url)
אתה אמור לראות מידע רב על הפרופיל מהידית שאתה מציין:
חילוץ אימיילים מהביוגרפיה
אתה יכול לחלץ כתובות דוא"ל מהביוגרפיה של Insta של כל פרופיל באמצעות ביטויים רגולריים. אתה צריך לייבא את ה-Python's מִחָדָשׁ הספרייה ומעבירים את הביטוי הרגולרי לאימות המייל כפרמטר ל- re.findall() שיטה:
יְבוּא instaloader
יְבוּא מִחָדָשׁ
# יצירת מופע של מחלקה Instaloader
bot = instaloader. Instaloader()
פרופיל = instaloader. Profile.from_username (bot.context, "עוֹשֶׁר")
הדפס("שם משתמש: ", profile.username)
הדפס("ביוגרפיה: ", profile.biography)
מיילים = re.findall (r"\b[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\.[A-Z|a-z]{2,}\b", profile.biography)
print("מיילים חולצו מ הביוגרפיה :)
הדפס(מיילים)
הסקריפט ידפיס כל דבר שהוא מזהה ככתובת דוא"ל בביו:
חילוץ נתוני תוצאות חיפוש מובילות
כשאתה מחפש משהו באינסטגרם, אתה מקבל מספר תוצאות כולל שמות משתמש והאשטאג. אתה יכול לחלץ את תוצאות החיפוש המובילות באמצעות ה get_profiles() ו get_hashtags() שיטות. אתה רק צריך לספק את שאילתת החיפוש ב- instaloader. TopSearchResults() שיטה. יתר על כן, אתה יכול לחזור ולהדפיס/לאחסן את התוצאות הבודדות.
יְבוּא instaloader
# יצירת מופע של מחלקת Instaloader
bot = instaloader. Instaloader()# ספק את שאילתת החיפוש כאן
search_results = instaloader. TopSearchResults (bot.context, 'מוּסִיקָה')# איטרציה על שמות המשתמש שחולצו
לשם משתמשבתוצאות חיפוש.get_profiles():
הדפס(שם משתמש)
# איטרציה על תגי ההאשטאג שחולצו
לסולמיתבתוצאות חיפוש.get_hashtags():
הדפס(סולמית)
הפלט יכלול את כל שמות המשתמש והתגיות התואמים:
חילוץ עוקבים ומעקבים של חשבון
אתה יכול לחלץ את העוקבים של חשבון, ואת אלה שהוא עוקב אחריו בעצמו, באמצעות Instaloader. תצטרך לספק שם משתמש וסיסמה באינסטגרם כדי לאחזר נתונים אלה.
לעולם אל תשתמש בחשבונות האישיים שלך כדי לחלץ נתונים מאינסטגרם מכיוון שהחשבון שלך עלול להיחסם באופן זמני או לצמיתות.
לאחר יצירת מופע של מחלקת Instaloader, עליך לספק את שם המשתמש והסיסמה שלך. זאת על מנת שהבוט יוכל להיכנס לאינסטגרם באמצעות חשבונך ולהביא את נתוני העוקבים והעוקבים.
לאחר מכן, עליך לספק את ידית האינסטגרם של פרופיל היעד. ה get_followers() ו get_followees() שיטות מחלצות את העוקבים והעוקבים. אתה יכול לקבל את שמות המשתמש של העוקבים והעוקבים באמצעות ה follower.username ו followee.username נכסים בהתאמה.
אם ברצונך לאחסן את התוצאות בקובץ CSV, תחילה עליך להמיר את הנתונים לאובייקט Pandas DataFrame. להשתמש ב pd. DataFrame() שיטה להמרת אובייקט רשימה ל-DataFrame.
לבסוף, אתה יכול לייצא את אובייקט ה-DataFrame לקובץ CSV באמצעות to_csv() שיטה. אתה צריך לעבור את filename.csv כפרמטר לשיטה זו כדי לקבל את הנתונים המיוצאים בפורמט קובץ CSV.
רק בעלי החשבון יכולים לראות את כל העוקבים והעוקבים. לא תוכל לחלץ את כל נתוני העוקבים והעוקבים בשיטה זו או אחרת.
# ייבוא ספריות
יְבוּא instaloader
יְבוּא פנדות כפי ש pd# יצירת מופע של מחלקת Instaloader
bot = instaloader. Instaloader()
bot.login (משתמש="שם המשתמש שלך", passwd="הסיסמה שלך")# טעינת פרופיל מנקודת אחיזה באינסטגרם
פרופיל = instaloader. Profile.from_username (bot.context, 'Your_target_account_insta_handle')# אחזור שמות המשתמש של כל העוקבים
followers = [follower.username עבור עוקב בפרופיל.get_followers()]# המרת הנתונים ל-DataFrame
followers_df = pd. DataFrame (עוקבים)# אחסון התוצאות בקובץ CSV
followers_df.to_csv('followers.csv', index=False)# אחזור שמות המשתמש של כל הבאים
followings = [followee.username עבור followee ב-profile.get_followees()]# המרת הנתונים ל-DataFrame
followings_df = pd. DataFrame (בעקבות)
# אחסון התוצאות בקובץ CSV
followings_df.to_csv('followings.csv', index=False)
הורד פוסטים מחשבון אינסטגרם
שוב, כדי להוריד פוסטים מכל חשבון, תצטרך לספק שם משתמש וסיסמה. זאת כדי שהבוט יוכל להיכנס לאינסטגרם באמצעות החשבון שלך. אתה יכול לאחזר את כל נתוני הפוסטים באמצעות ה get_posts() שיטה. ואתה יכול לחזור ולהוריד את כל הפוסטים הבודדים באמצעות download_post() שיטה.
# ייבוא ספריות
יְבוּא instaloader
יְבוּא פנדות כפי ש pd# צור מופע של מחלקה Instaloader
bot = instaloader. Instaloader()
bot.login (משתמש="שם המשתמש שלך",passwd="הסיסמה שלך")# טעינת פרופיל מנקודת אחיזה באינסטגרם
פרופיל = instaloader. Profile.from_username (bot.context, 'Your_target_account_insta_handle')# אחזור כל הפוסטים באובייקט
פוסטים = profile.get_posts()
# איטרציה והורדה של כל הפוסטים הבודדים
עבור אינדקס, פרסם ב-enumerate (פוסטים, 1):
bot.download_post (פוסט, target=f"{profile.username}_{index}")
לגרד את האינטרנט באמצעות Python
גירוד נתונים או גירוד אינטרנט היא אחת הדרכים הנפוצות ביותר לחילוץ מידע שימושי מהרשת. אתה יכול להשתמש בנתונים שאתה שואב לשיווק, יצירת תוכן או קבלת החלטות.
Python היא השפה המועדפת לגרידת נתונים. ספריות כמו BeautifulSoup, Scrapy ו-Pandas מפשטות חילוץ, ניתוח והדמיה של נתונים.