Pandas היא ספריית Python בקוד פתוח המשמשת בעיקר למניפולציה וניתוח נתונים. הוא בנוי על גבי ספריית NumPy ומספק מבני נתונים בעלי ביצועים גבוהים וקלים לשימוש וכלי ניתוח נתונים עבור שפת התכנות Python.
במאמר זה תלמדו כיצד לבצע 6 פעולות בסיסיות באמצעות Pandas.
שימוש בדוגמאות של פנדות
אתה יכול להפעיל את הדוגמאות במאמר זה באמצעות מחברות חישוביות כמו מחברת Jupyter, גוגל קולאב, וכו. אתה יכול גם להפעיל את הדוגמאות על ידי הזנת הקוד ישירות לתוך המתורגמן Python במצב אינטראקטיבי.
אם ברצונך לעיין בקוד המקור המלא המשמש במאמר זה, תוכל לגשת לקובץ Python Notebook מכאן מאגר GitHub.
1. כיצד לייבא פנדות כ-pd ולהדפיס את מספר הגרסה
אתה צריך להשתמש ב יְבוּא מילת מפתח לייבא כל ספרייה ב- Python. פנדות מיובאות בדרך כלל תחת pd כינוי. עם גישה זו, אתה יכול להתייחס לחבילת Pandas בתור pd במקום פנדות.
לייבא פנדות כ-pd
הדפס (pd.__version__)
תְפוּקָה:
1.2.4
2. איך ליצור סדרה בפנדות
Pandas Series הוא מערך חד מימדי שמכיל נתונים מכל סוג שהוא. זה כמו עמודה בטבלה. אתה יכול ליצור סדרה באמצעות מערכי numpy, פונקציות numpy, רשימות, מילונים, ערכים סקלרים וכו'.
ערכי הסדרה מסומנים במספר האינדקס שלהם. כברירת מחדל, לערך הראשון יש אינדקס 0, לערך השני יש אינדקס 1, וכן הלאה. כדי לתת שם לתוויות משלך, עליך להשתמש ב- אינדקס טַעֲנָה.
כיצד ליצור סדרה ריקה
s = pd. סדרה (dtype='float64')
ס
תְפוּקָה:
Series([], dtype: float64)
בדוגמה שלמעלה, סדרה ריקה עם ה- לָצוּף נוצר סוג נתונים.
כיצד ליצור סדרה באמצעות מערך NumPy
לייבא פנדות כ-pd
ייבוא numpy בתור np
d = np.array([1, 2, 3, 4, 5])
s = pd. סדרה (ד)
ס
תְפוּקָה:
0 1
1 2
2 3
3 4
4 5
dtype: int32
קָשׁוּר: פעולות NumPy למתחילים
כיצד ליצור סדרה באמצעות רשימה
d = [1, 2, 3, 4, 5]
s = pd. סדרה (ד)
ס
תְפוּקָה:
0 1
1 2
2 3
3 4
4 5
dtype: int64
כיצד ליצור סדרה עם אינדקס
כדי ליצור סדרה עם אינדקס, עליך להשתמש ב- אינדקס טַעֲנָה. מספר האינדקסים חייב להיות שווה למספר האלמנטים בסדרה.
d = [1, 2, 3, 4, 5]
s = pd. סדרה (ד, אינדקס=["אחד", "שתיים", "שלוש", "ארבע", "חמש"])
ס
תְפוּקָה:
אחד 1
שניים 2
שלוש 3
ארבע 4
חמש 5
dtype: int64
כיצד ליצור סדרה באמצעות מילון
מפתחות המילון הופכים לתוויות של הסדרה.
d = {"one": 1,
"שניים": 2,
"שלושה": 3,
"ארבעה": 4,
"חמש": 5}
s = pd. סדרה (ד)
ס
תְפוּקָה:
אחד 1
שניים 2
שלוש 3
ארבע 4
חמש 5
dtype: int64
כיצד ליצור סדרה באמצעות ערך סקלארי
אם ברצונך ליצור סדרה באמצעות ערך סקלרי, עליך לספק את אינדקס טַעֲנָה.
s = pd. סדרה (1, אינדקס = ["a", "b", "c", "d"))
ס
תְפוּקָה:
א 1
ב 1
ג 1
ד 1
dtype: int64
3. כיצד ליצור מסגרת נתונים בפנדות
DataFrame הוא מבנה נתונים דו מימדי שבו הנתונים מיושרים בצורה של שורות ועמודות. ניתן ליצור DataFrame באמצעות מילונים, רשימות, רשימת מילונים, מערכי numpy וכו'. בעולם האמיתי, DataFrames נוצרים באמצעות אחסון קיים כמו קבצי CSV, קבצי אקסל, מסדי נתונים של SQL וכו'.
אובייקט DataFrame תומך במספר תכונות ושיטות. אם אתה רוצה לדעת יותר עליהם, אתה יכול לבדוק את התיעוד הרשמי של מסגרת נתונים של פנדה.
כיצד ליצור DataFrame ריק
df = pd. DataFrame()
הדפס (df)
תְפוּקָה:
DataFrame ריק
עמודות: []
אינדקס: []
כיצד ליצור DataFrame באמצעות רשימה
listObj = ["MUO", "טכנולוגיה", "פשוטה"]
df = pd. DataFrame (listObj)
הדפס (df)
תְפוּקָה:
0
0 MUO
1 טכנולוגיה
2 מפושט
כיצד ליצור DataFrame באמצעות מילון של ndarray/Lists
batmanData = {'שם הסרט': ['באטמן מתחיל', 'האביר האפל', 'האביר האפל עולה'],
'שנת השחרור': [2005, 2008, 2012]}
df = pd. DataFrame (batmanData)
הדפס (df)
תְפוּקָה:
שם הסרט שנת יציאה
0 באטמן מתחיל 2005
1 האביר האפל 2008
2 האביר האפל עולה 2012
כיצד ליצור DataFrame באמצעות רשימת רשימות
data = [['Alex', 601], ['Bob', 602], ['Cataline', 603]]
df = pd. DataFrame (נתונים, עמודות = ['Name', 'Roll No.'])
הדפס (df)
תְפוּקָה:
שם גליל מס.
0 אלכס 601
1 בוב 602
2 Cataline 603
כיצד ליצור DataFrame באמצעות רשימת מילונים
data = [{'Name': 'Alex', 'Roll No.': 601},
{'Name': 'Bob', 'Roll No.': 602},
{'Name': 'Cataline', 'Roll No.': 603}]
df = pd. DataFrame (נתונים)
הדפס (df)
תְפוּקָה:
שם גליל מס.
0 אלכס 601
1 בוב 602
2 Cataline 603
קָשׁוּר: כיצד להמיר רשימה למילון ב- Python
כיצד ליצור DataFrame באמצעות פונקציית zip()
להשתמש ב רוכסן() פונקציה למיזוג רשימות ב- Python.
שם = ['אלכס', 'בוב', 'קטליין']
RollNo = [601, 602, 603]
listOfTuples = list (zip (שם, RollNo))
df = pd. DataFrame (listOfTuples, עמודות = ['Name', 'Roll No.'])
הדפס (df)
תְפוּקָה:
שם גליל מס.
0 אלכס 601
1 בוב 602
2 Cataline 603
4. כיצד לקרוא נתוני CSV בפנדות
קובץ "ערכים מופרדים בפסיק" (CSV) הוא קובץ טקסט מופרד שמשתמש בפסיק כדי להפריד בין ערכים. אתה יכול לקרוא קובץ CSV באמצעות ה read_csv() שיטה בפנדות. אם ברצונך להדפיס את כל ה-DataFrame, השתמש ב- to_string() שיטה.
בדוגמאות זו ובדוגמאות הבאות, זה קובץ CSV ישמש לביצוע הפעולות.
df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
print (df.to_string())
תְפוּקָה:
5. כיצד לנתח DataFrames באמצעות שיטות head(), tail() ו-info().
כיצד להציג נתונים באמצעות שיטת head()
ה רֹאשׁ() השיטה היא אחת הדרכים הטובות ביותר לקבל סקירה מהירה של ה-DataFrame. שיטה זו מחזירה את הכותרת ומספר השורות שצוין, החל מלמעלה.
df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
הדפס (df.head (10))
תְפוּקָה:
אם לא תציין את מספר השורות, 5 השורות הראשונות יוחזרו.
df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
print (df.head())
תְפוּקָה:
כיצד להציג נתונים באמצעות שיטת tail()
ה זָנָב() השיטה מחזירה את הכותרת ואת מספר השורות שצוין, החל מלמטה.
df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
print (df.tail (10))
תְפוּקָה:
אם לא תציין את מספר השורות, 5 השורות האחרונות יוחזרו.
df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
print (df.tail())
תְפוּקָה:
כיצד לקבל מידע על הנתונים
ה info() שיטות מחזירות סיכום קצר של DataFrame כולל אינדקס dtype ו-dtypes עמודה, ערכים שאינם ריק ושימוש בזיכרון.
df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
print (df.info())
תְפוּקָה:
6. כיצד לקרוא נתוני JSON בפנדות
JSON (יavaסקריפט Object נotation) הוא פורמט קל משקל להחלפת נתונים. אתה יכול לקרוא קובץ JSON באמצעות ה read_json() שיטה בפנדות. אם ברצונך להדפיס את כל ה-DataFrame, השתמש ב- to_string() שיטה.
בדוגמה למטה, זה קובץ JSON משמש לביצוע הפעולות.
קָשׁוּר: מה זה JSON? סקירה כללית של הדיוט
df = pd.read_json(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/google_markers.json')
print (df.to_string())
תְפוּקָה:
רענן את הידע שלך ב-Python עם פונקציות ושיטות מובנות
פונקציות עוזרות לקצר את הקוד ולשפר את יעילותו. פונקציות ושיטות כמו לְהַפחִית(), לְפַצֵל(), לִמְנוֹת(), eval(), עָגוֹל(), וכו. יכול להפוך את הקוד שלך לחזק וקל להבנה. תמיד טוב לדעת על פונקציות ושיטות מובנות מכיוון שהם יכולים לפשט את משימות התכנות שלך במידה רבה.
הספרייה הסטנדרטית של Python מכילה פונקציות רבות שיעזרו במשימות התכנות שלך. למד על הקוד השימושי ביותר וצור קוד חזק יותר.
קרא הבא
- תִכנוּת
- פִּיתוֹן
- בניית אתרים
- תִכנוּת
- ניתוח נתונים

יובראג' הוא סטודנט לתואר ראשון במדעי המחשב באוניברסיטת דלהי, הודו. הוא נלהב מ-Full Stack Development Web. כשהוא לא כותב, הוא בוחן את העומק של טכנולוגיות שונות.
הירשם לניוזלטר שלנו
הצטרף לניוזלטר שלנו לקבלת טיפים טכניים, ביקורות, ספרים אלקטרוניים בחינם ומבצעים בלעדיים!
לחץ כאן כדי להירשם