דמיינו לעצמכם בוקר מוקדם שבו אתם לוגמים מכוס קפה חמה, והמחשב שלכם קורא לכם את הכותרות האחרונות - הכל לבד. זה לא נשמע מדהים?

ובכן, עם Python, אתה יכול לבנות קורא חדשות מותאם אישית משלך, שיקריא עבורך את כל הכותרות המובילות, יחד עם הקטעים של כל כותרת. כן זה נכון. על ידי שימוש בספריות הנכונות, אתה יכול לגרום לפיתון לעשות את כל שגרות הבוקר שלך, מבלי שתצטרך לקרוא כל מילה ומילה בעצמך.

כך תוכל לכתוב את הקוד הזה ולצבוט אותו לאתר החדשות המועדף עליך.

דרישות מוקדמות להפעלת הקוד

לפני שאתה קופץ ומתחיל לכתוב את הקוד, עליך לעמוד בכמה דרישות מוקדמות. אלו הן כמה דרישות בסיסיות ביותר, שיכולות להפוך את השימוש ב-Python לקל ויעיל יותר.

  1. פִּיתוֹן: התקנת הגרסה האחרונה של Python תהיה החלטה טובה. אתה יכול להתקין כל Python IDE לקבלת התוצאות הטובות ביותר.
  2. אתר חדשות/גישה לאינטרנט: מכיוון שקוד Python קורא את הכותרות העליונות מהאתר המועדף עליך, עליך לוודא שאתה יכול לגשת לאתר בזמן הפעלת הקוד הזה.

הקוד כולו כתוב ב-Jupyter Notebook, פופולרי Python IDE עבור המדריך הזה. בנוסף, אתר החדשות של India Today מקודד בתוך הקוד לדוגמה.

כדי להוריד את Jupyter Notebook, אתה יכול להשתמש בו כחלק מחבילת anaconda, או להוריד גרסה עצמאית למערכת שלך.

instagram viewer

הורד:אנקונדה | מחברת Jupyter

בלי להכביר מילים, בואו נעמיק בקוד.

כתיבת הקוד בפייתון

כדי להתחיל, עליך לייבא מספר ספריות Python, שכל אחת מהן משרתת מטרות שונות.

ייבוא ​​win32com.client בתור wincl
מ-urllib.request יבוא urlopen כ-ureq
מאת bs4 ייבוא ​​BeautifulSoup כמרק
sp = wincl. Dispatch("SAPI.spVoice")

איפה:

  • win32com.client: ספרייה זו מקיימת אינטראקציה עם מכשירי Windows ומפעילה תוכניות Python בצורה חלקה.
  • urllib.request: ספרייה זו מטפלת בערכי URL ממודול הבקשה.
  • bs4: ספריית BS4 מכילה את הפונקציה Beautiful Soup, אשר מגרדת נתונים מאתרים באמצעות Python.
  • sp = wincl. Dispatch("SAPI.spVoice"): הפעל את הפקודות הקוליות ב-Windows.

קוד זה יעבוד על Windows בלבד, מכיוון שתקרא לספריית win32.com.client.

לאחר מכן, עליך להגדיר את כתובת האתר (קישור) של האתר בתוך כתובת אתר משתנה, המאוחסן בזיכרון של Python.

url = https://www.indiatoday.in/top-stories

צור לקוח משתנה חדש כדי לאחסן את פקודת פתיחת כתובת האתר.

לקוח = ureq (כתובת אתר)
הדפס (לקוח)

איפה:

  • לָקוּחַ: משתנה חדש.
  • ureq: פונקציית Python מיובאת מה-urllib.request, שפותחת את כתובת האתר המאוחסנת.

מכיוון שפתחת את כתובת האתר בזיכרון, הגיע הזמן לבדוק האם האתר המדובר מאפשר חיבורים לא מאובטחים דרך Python. אתה יכול להדפיס את משתנה הלקוח ולבדוק את הפלט.

ישנן שתי אפשרויות עם פקודת ההדפסה:

  • שגיאת HTTP: כאשר אתר אינטרנט מאובטח, אינך יכול לגרד את התוכן באמצעות Python.
  • קטע קוד: אם קטע קוד מוחזר לאחר הפעלת האתר, הנח שאתה יכול בקלות למשוך את הכותרות.

לאחר שהגדרת את כתובת האתר של אתר החדשות בפקודה URL, הגיע הזמן לייבא את קוד ה-HTML למשתנה.

page_html = client.read()
הדפס (page_html)

עליך להדפיס את קוד ה-HTML של האתר המיובא לפייתון כצעד זהירות. אתה יכול אפילו להתאים את הקוד הזה לקוד האתר הזמין תחת לִבדוֹק אוֹפְּצִיָה.

לפני המרת הקוד, עליך לסגור את האתר מהזיכרון של Python באמצעות הפקודה סגור.

client.close()

מכיוון שקוד ה-HTML מיובא לתוך משתנה Python, עליך להמיר אותו לפורמט קריא של Python כדי להחיל את למצוא ו מצא הכל פקודות לחיפוש מילות מפתח.

אתה יכול להעביר את הפקודה הבאה כדי להמיר את קוד ה-HTML:

page_soup = soup (page_html, "html.parser")

איפה:

  • page_sup: משתנה חדש.
  • מרק: כינוי עבור ה מודול מרק יפה.
  • page_html: משתנה המכיל את קוד ה-HTML מהאתר.
  • html_parser: תחביר ברירת מחדל להמרת קוד ה-HTML.

לאחר שהקוד מוכן לשימוש, הגיע הזמן לבחון את קוד ה-HTML של האתר כדי להתחיל לחפש מילות מפתח בכותרת.

כדי לעשות זאת, לחץ באמצעות לחצן העכבר הימני בכל מקום באתר, ולחץ על בדוק. פעולה זו תפתח את קוד ה-HTML של האתר המדובר.

בחלון הקוד של האתר, גלול מסביב, עד שתאתר את תגי המכולה המאחסנים את הכותרות.

אלה כלולים בתוך צפייה-תוכן תגיות באתר India Today. המיכלים של כל אתר חדשות משתנים, אבל אתה אמור להיות מסוגל לנווט בקוד בקלות יחסית.

articles = page_soup.find("div", { "class": "view-content" })

לבסוף, עליך ללכוד את תגי המשנה, המכילים את הכותרות העיקריות ש-Python תקריא לך.

articles = articles.findAll("div", {"class": "catagory-listing"})

מיכל התוכן של התצוגה יכיל מספר כותרות, המעטפת החיצונית עבור הכותרות שלך.

כדי ללכוד את תגי H2 ואת הקטעים הרשומים עם כל כותרת, אתה צריך להפעיל לולאה.

i = 1
עבור x במאמרים:
title = x.find("h2").text
para = x.find("p").text
הדפס (i, כותרת, "
", "
", para,"
", "
")
sp. דבר (כותרת)
sp. דבר (סעיף)
i=i+1

איפה:

  • אני: משתנה מונה חדש, אשר יוגדל אוטומטית.
  • כותרת: משתנה חדש לשמירת הכותרת (h2).
  • סעיף: משתנה חדש שיכיל את הפסקאות המשויכות לכל H2.
  • הדפס: כותרת הכותרת והפארא יודפסו בממשק Python.
  • sp. דבר (כותרת): Python יקרא כל כותרת מאוחסנת.
  • sp. דבר (סעיף): Python יקרא כל קטע פסקה מאוחסן.
  • i = i+1: פקודה זו מגדילה אוטומטית את המספר הסידורי המשויך לכל כותרת המוצגת בממשק של Python.

שימוש במודול המרק היפה של Python כדי לקרוא את החדשות היומיות שלך

בכל פעם שתפעיל את הקוד, כותרות חדשות מאתר החדשות יורדו לפני הקריאה בקול. Python מבצעת את הקוד בכל פעם שאתה מפעיל את קבוצת הקודים, ובכך שומר אותך מעודכן בשינויים באתר.

הכותרות הישנות יותר ימשיכו להיות מוצגות ולהקריא על ידי Python עד שתרענן ותפעיל מחדש את הקוד.

קל להשתמש ב-Python כדי לקרוא את הכותרות היומיות שלך

Python, כשפת קוד פתוח, מציעה סדרה של כלים כגון מרק יפה, סלניום ומסגרות אחרות - למשתמשים מתחילים ומתקדמים כאחד.

אם אתה רוצה לקבל את החדשות היומיות שלך בקול, Python עושה את זה קל. לימוד השפה הספציפית הזו יכול גם לעזור לך להפוך למתכנת טוב יותר בכל התחומים.

10 כלים שימושיים למפתחי Python

בין אם אתה זקוק לכלי Python למדעי נתונים, למידת מכונה, פיתוח אתרים או כל דבר שביניהם, רשימה זו סיפקת אותך.

קרא הבא

לַחֲלוֹקצִיוּץאימייל
נושאים קשורים
  • תִכנוּת
  • פִּיתוֹן
  • חֲדָשׁוֹת
  • טיפים למחשב
  • תִכנוּת
על הסופר
גורב סיאל (56 מאמרים שפורסמו)

לגאורב סיאל ניסיון של שנתיים בכתיבה, כתיבה עבור שורה של חברות שיווק דיגיטלי ומסמכי מחזור חיים של תוכנה.

עוד מאת גורב סיאל

הירשם לניוזלטר שלנו

הצטרף לניוזלטר שלנו לקבלת טיפים טכניים, ביקורות, ספרים אלקטרוניים בחינם ומבצעים בלעדיים!

לחץ כאן כדי להירשם