מאגר הסרטים באינטרנט (IMDb) הוא מסד הנתונים המקוון הגדול ביותר המכיל מידע הקשור לסרטים, סדרות טלוויזיה, סרטונים ביתיים, משחקי וידאו ותוכן סטרימינג. מסד הנתונים המקוון מכיל מיליוני רשומות מדויקות שתוכל להשתמש בהן כדי לבצע ניתוח נתונים.
Cinemagoer (לשעבר IMDbPY) היא ספריית Python לניהול ואחזור הנתונים של מסד הנתונים של סרטי IMDb. אתה יכול לגשת לנתונים על סרטים, אנשים וחברות, שניתן להשתמש בהם לניתוח נוסף.
התקנת ספריות נדרשות
אתה צריך להתקין את איש קולנוע ספריית Python כדי לגשת ל IMDb מאגר מידע. הפעל את הפקודה הבאה בשורת הפקודה כדי להתקין את הספרייה:
צִפצוּף להתקין איש קולנוע
אתה חייב שיהיה לך pip מותקן במערכת שלך להתקנת ספריות Python חיצוניות.
הקוד המשמש בפרויקט זה זמין ב-a מאגר GitHub והוא בחינם עבורך לשימוש תחת רישיון MIT.
חילוץ נתוני IMDb באמצעות Python
עליך לייבא את ספריית צופי הקולנוע לפני השימוש בה בקוד שלך.
מ imdb יְבוּא איש קולנוע
ia = Cinemagoer()
הקוד שלמעלה מייבא את ספריית צופי הקולנוע ויוצר מופע של מחלקת הקולנוע.
חיפוש סרטים
אתה יכול לחפש סרטים עם שם נתון (או דומה) באמצעות ה search_movie() שיטה. לדוגמה, אם אתה רוצה לחפש סרטים עם הכותרת "רוק", עליך להפעיל את הקוד הבא:
מ imdb יְבוּא איש קולנוע
# יצירת מופע של מחלקת Cinemagoer
ia = Cinemagoer()
# חיפוש סרטים שיש להם רוק בשמם
movies = ia.search_movie('סלע')
הדפס(סרטים[0])
זה אמור להדפיס את הסרט הראשון שהוא מוצא, למשל:
אתה יכול לקבל סרט לפי מזהה ה-IMDb שלו. לאחר מכן תוכל לחלץ מידע נוסף כמו שמות במאים וז'אנרים. אתה צריך לולאה ברשימה כדי לקבל מידע אישי.
מ imdb יְבוּא איש קולנוע
# יצירת מופע של מחלקת Cinemagoer
ia = Cinemagoer()# קבלת סרט לפי IMDb ID
movie = ia.get_movie('0468569')
הדפס(סרט)# הדפסת שמות הבמאים של הסרט
הדפס('במאים:')לבמאי בסרט['במאים']:
הדפס (במאי['שֵׁם'])# הדפסת הז'אנרים של הסרט
הדפס('ז'אנרים:')
לז'אנר בסרט['ז'אנרים']:
הדפס(ז'ָאנר)
בפלט, אתה אמור לראות את שם הסרט הנתון, הבמאים שלו והז'אנרים שלו:
מחפש אדם
אתה יכול לחפש אנשים באמצעות search_person() שיטה. לדוגמה, אם אתה רוצה לחפש "Heath", עליך להפעיל את הקוד הבא:
מ imdb יְבוּא איש קולנוע
# יצירת מופע של מחלקת Cinemagoer
ia = Cinemagoer()
# מחפש אנשים עם הית' בשמותיהם
persons = ia.search_person('עֲרָבָה')
הדפס(אנשים[0])
תראה את השם של האדם התואם הראשון שהחיפוש מוצא:
חיפוש חברות
אתה יכול לחפש חברות באמצעות search_company() שיטה. לדוגמה, אם אתה רוצה לחפש "Universal", עליך להפעיל את הקוד הבא:
מ imdb יְבוּא איש קולנוע
# יצירת מופע של מחלקת Cinemagoer
ia = Cinemagoer()
# מחפש חברות עם אוניברסלי בשמות שלהן
חברות = ia.search_company('אוניברסלי')
הדפס(חברות)
תקבל את רשימת כל החברות שיש להן את יוניברסל בשמן.
אתה יכול גם לאחזר נתוני אדם וחברה באמצעות המזהה שלו.
מ imdb יְבוּא איש קולנוע
# יצירת מופע של מחלקת Cinemagoer
ia = Cinemagoer()# קבלת נתוני אדם לפי תעודת זהות
person = ia.get_person('0005132')
הדפס (אדם['שֵׁם'])
הדפס (אדם['תאריך לידה'])
# קבלת נתוני חברה לפי תעודת זהות
company = ia.get_company('0005073')
הדפס (חברה['שֵׁם'])
הפלט יציג את פרטי האדם ואת שם החברה:
מציאת סרטים מובילים ותחתונים
אתה יכול לאחזר את הנתונים עבור 250 הסרטים המובילים ו-100 התחתונים באמצעות get_top250_movies() ו get_bottom100_movies() שיטות, בהתאמה:
מ imdb יְבוּא איש קולנוע
# יצירת מופע של מחלקת Cinemagoer
ia = Cinemagoer()# מציאת 250 הסרטים המובילים
top = ia.get_top250_movies()
הדפס(חלק עליון[0])
# מציאת 100 הסרטים הנמוכים ביותר
bottom = ia.get_bottom100_movies()
הדפס(תַחתִית[0])
בתגובה, תראה את שמו של הסרט הטוב ביותר, ואת שמו של הגרוע ביותר:
ספריית צופי הקולנוע מספקת גם כמה שיטות אחרות כמו get_top250_tv(), get_popular100_movies(), ו get_top250_indian_movies().
ניתוח נתונים הוא הערכה של נתונים באמצעות כלים אנליטיים או סטטיסטיים כדי לחלץ מידע. הפופולריות של ניתוח נתונים גדלה מדי יום. כיום משתמשים בו עסקים, חברות שיווק וקבוצות ספורט. התהליך המלא של ניתוח נתונים כולל הגדרת יעדים, הצגת שאלות, איסוף נתונים, קרצוף נתונים, ניתוח נתונים ותוצאות סיכום.
אתה יכול לקבל מערכי נתונים עבור הפרויקטים שלך באמצעות ספריות Python כמו Cinemagoer או באמצעות פלטפורמות מקוונות כמו Kaggle. לצד שפות מלאות כמו Python ו-R, אתה יכול להשתמש בכלים אחרים כמו Microsoft Excel, Tableau ו-Stata כדי לבצע ניתוח נתונים.