פייתון, כשפה, היא בעלת ערך רב, במיוחד כאשר אתה רוצה לעבוד עם נתונים מובנים. מכיוון שאנשים מאחסנים הרבה נתונים בקבצי Excel, הכרחי לאחד מספר קבצים כדי לחסוך זמן ומאמץ.

Python מאפשר לך לעשות בדיוק את זה; לא משנה כמה קבצי אקסל תרצו לשלב, תוכלו לעשות זאת בקלות יחסית. בהתחשב במגוון הספריות והמשאבים של צד שלישי, אתה יכול לייבא ולהשתמש בכלים הרב-גוניים של Python כדי לבצע את ההצעות שלך.

במדריך זה, תצטרך להתקין ולהשתמש בספריות Pandas כדי לייבא נתונים לפייתון לפני איחודם.

התקן את ספריות Pandas ב-Python

Pandas היא ספריית צד שלישי שתוכל להתקין ב- Python. בחלק מה-IDEs כבר מותקנות Pandas.

אם אתה משתמש ב- גרסת IDE זה לא מגיע עם פנדות מותקנות מראש, תהיו בטוחים שאתם יכולים להתקין אותו ישירות ב-Python.

הנה איך להתקין Pandas:

pip להתקין פנדות

אם אתה משתמש ב-Jupyter Notebook, אתה יכול להתקין Pandas ישירות עם פקודת PIP. לרוב, כאשר התקנת את Jupyter עם Anaconda, יש סיכוי גבוה שכבר יהיו פנדות זמינות לשימוש ישיר.

אם אינך יכול להתקשר ל-Pandas, אתה יכול להשתמש בפקודה לעיל כדי להתקין אותם ישירות.

שילוב קבצי Excel עם Python

instagram viewer

ראשית, עליך ליצור תיקיה במיקום המועדף עליך עם כל קבצי האקסל. לאחר שהתיקיה מוכנה, אתה יכול להתחיל לכתוב את הקוד לייבא את הספריות.

אתה תשתמש בשני משתנים בקוד זה:

  1. פנדות: ספריית Pandas מספקת את מסגרות הנתונים לאחסון קבצי Excel.
  2. מערכת הפעלה: הספרייה מועילה לקריאת נתונים מהתיקייה של המכשיר שלך

כדי לייבא ספריות אלו, השתמש בפקודות הבאות:

ייבוא ​​פנדות כ-pd
ייבוא ​​מערכת הפעלה
  • יְבוּא: תחביר Python המשמש לייבוא ​​הספריות ב- Python
  • פנדות: שם הספרייה
  • pd: כינוי שניתן לספרייה
  • מערכת הפעלה: ספריה לגישה לתיקיית המערכת

לאחר שייבאת את הספריות, צור שני משתנים לאחסון נתיב קובץ הקלט והפלט. יש צורך בנתיב קובץ הקלט כדי לגשת לתיקיית הקבצים. נתיב קובץ הפלט נחוץ מכיוון שהקובץ המשולב ייצא לשם.

אם אתה משתמש ב-Python, ודא שאתה משנה את הנטוי האחורי ל-Forward-Slash (\ ל /)

input_file_path = "C:/Users/gaurav/OneDrive/Desktop/Excel files/"
output_file_path = "C:/Users/gaurav/OneDrive/Desktop/"

צרף את / בסוף גם כדי להשלים את השבילים.

קבצי התיקיה זמינים ברשימה. צור רשימה לאחסון כל הפניות לקבצים של תיקיית הקלט באמצעות ה- listdir פונקציה מה מערכת הפעלה סִפְרִיָה.

אם אינך בטוח בפונקציות הזמינות בספריה, תוכל להשתמש ב- דיר פונקציה עם שם הספרייה. לדוגמה, כדי לבדוק את הגרסה המדויקת של פונקציית listdir, אתה יכול להשתמש בפקודה כדלקמן:

dir (OS)

הפלט יהיה מורכב מכל הפונקציות המשויכות הזמינות בספריית מערכת ההפעלה. הפונקציה listdir היא אחת מהפונקציות הרבות הזמינות בספרייה זו.

צור משתנה חדש לאחסון קבצי הקלט מהתיקיה.

excel_file_list = os.listdir (נתיב_קובץ_קלט)

הדפס משתנה זה כדי לראות את שמות הקבצים המאוחסנים בתיקייה. כל הקבצים המאוחסנים בתיקייה מוצגים לאחר השימוש בפונקציית ההדפסה.

print (excel_file_list)

לאחר מכן, עליך להוסיף מסגרת נתונים חדשה כדי לאחסן כל קובץ Excel. דמיינו מסגרת נתונים כמיכל לאחסון נתונים. הנה הפקודה ליצירת מסגרת נתונים.

df = pd. DataFrame()
  • df: משתנה לאחסון הערך של ה-DataFrame
  • pd: כינוי עבור ה ספריית פנדות
  • DataFrame: תחביר ברירת מחדל להוספת מסגרת נתונים

בתיקיית הקלט יש שלושה .xlsx קבצים בדוגמה זו. שמות הקבצים הם:

File1_excel.xlsx
File2_excel.xlsx
File3_excel.xlsx

כדי לפתוח כל קובץ מתיקיה זו, עליך להפעיל לולאה. הלולאה תפעל עבור כל אחד מהקבצים ברשימה שנוצרה למעלה.

כך תוכל לעשות זאת:

עבור excel_files ב-exel_file_list:

לאחר מכן, יש צורך לבדוק את הסיומות של הקבצים מכיוון שהקוד יפתח קבצי XLSX בלבד. כדי לבדוק קבצים אלה, אתה יכול להשתמש ב- אם הַצהָרָה.

להשתמש ב נגמר עם לתפקד למטרה זו, כדלקמן:

עבור excel_files ב-exel_file_list:

if excel_files.endswith(".xlsx"):

  • excel_files: רשימה עם כל ערכי הקובץ
  • נגמר עם: פונקציה לבדיקת הסיומת של הקבצים
  • (".xlsx"): ערך מחרוזת זה יכול להשתנות, בהתאם למה שאתה רוצה לחפש

כעת לאחר שזיהית את קובצי ה-Excel, תוכל ליצור מסגרת נתונים חדשה לקריאה ולאחסן את הקבצים בנפרד.

עבור excel_files ב-exel_file_list:

if excel_files.endswith(".xlsx"):

df1 = pd.read_excel (input_file_path+excel_files)

  • df1: מסגרת נתונים חדשה
  • pd: ספריית פנדות
  • read_excel: פונקציה לקריאת קבצי Excel בתוך ספריית Pandas
  • input_file_path: נתיב התיקיה שבה מאוחסנים הקבצים
  • excel_files: כל משתנה המשמש בלולאת for

כדי להתחיל לצרף את הקבצים, עליך להשתמש ב- לְצַרֵף פוּנקצִיָה.

עבור excel_files ב-exel_file_list:

if excel_files.endswith(".xlsx"):

df1 = pd.read_excel (input_file_path+excel_files)
df = df.append (df1)

לבסוף, כעת, כאשר מסגרת הנתונים המאוחדים מוכנה, אתה יכול לייצא אותה למיקום הפלט. במקרה זה, אתה מייצא את מסגרת הנתונים לקובץ XLSX.

df.to_excel (output_file_path+"Consolidated_file.xlsx")
  • df: מסגרת נתונים לייצוא
  • להצטיין: הפקודה המשמשת לייצוא הנתונים
  • נתיב_קובץ_output: נתיב שהוגדר לאחסון הפלט
  • Consolidated_file.xlsx: שם הקובץ המאוחד

כעת, בואו נסתכל על הקוד הסופי:

#Pandas משמש כמסגרת נתונים לטיפול בקובצי Excel
לייבא פנדות כ-pd
ייבוא ​​מערכת הפעלה

# שנה את האלכסון מ-"\" ל-"/", אם אתה משתמש במכשירי Windows

input_file_path = "C:/Users/gaurav/OneDrive/Desktop/Excel files/"
output_file_path = "C:/Users/gaurav/OneDrive/Desktop/"

#צור רשימה לאחסון כל הפניות לקבצים של תיקיית הקלט באמצעות הפונקציה listdir מספריית מערכת ההפעלה.
#כדי לראות את התוכן של ספריה (כמו הפונקציה listdir, אתה יכול להשתמש בפונקציית dir על שם הספרייה).
#השתמש ב-dir (שם_ספרייה) כדי לרשום תוכן

excel_file_list = os.listdir (נתיב_קובץ_קלט)

#הדפס את כל הקבצים המאוחסנים בתיקייה, לאחר הגדרת הרשימה
excel_file_list

# ברגע שכל קובץ נפתח, השתמש בפונקציית התוספת כדי להתחיל לאחד את הנתונים המאוחסנים במספר קבצים

#צור מסגרת נתונים חדשה וריקה כדי לטפל בייבוא ​​קבצי Excel
df = pd. DataFrame()

#הפעל לולאה ללולאה דרך כל קובץ ברשימה
עבור excel_files ב-exel_file_list:
#check עבור קבצי סיומת ‎.xlsx בלבד
if excel_files.endswith(".xlsx"):
#צור מסגרת נתונים חדשה כדי לקרוא/לפתוח כל קובץ Excel מרשימת הקבצים שנוצרו למעלה
df1 = pd.read_excel (input_file_path+excel_files)
#append כל קובץ לתוך מסגרת הנתונים הריקה המקורית
df = df.append (df1)

#העבר פלט סופי לקובץ Excel (xlsx) בנתיב הפלט
df.to_excel (output_file_path+"Consolidated_file.xlsx")

שימוש ב-Python לשילוב חוברות עבודה מרובות של Excel

ה-Pandas של Python הוא כלי מצוין למשתמשים מתחילים ומתקדמים כאחד. הספרייה נמצאת בשימוש נרחב על ידי מפתחים שרוצים לשלוט ב-Python.

גם אם אתה מתחיל, אתה יכול להפיק תועלת עצומה על ידי לימוד הניואנסים של Pandas וכיצד הספרייה משמשת בתוך Python.

6 מבצעי פנדה למתחילים

קבל את השליטה על פנדות עם פעולות המתחילות האלה.

קרא הבא

לַחֲלוֹקצִיוּץאימייל
נושאים קשורים
  • תִכנוּת
  • פִּיתוֹן
  • Microsoft Excel
  • גיליון אלקטרוני
על הסופר
גורב סיאל (59 מאמרים שפורסמו)

לגאורב סיאל ניסיון של שנתיים בכתיבה, כתיבה עבור שורה של חברות שיווק דיגיטלי ומסמכי מחזור חיים של תוכנה.

עוד מאת גורב סיאל

הירשם לניוזלטר שלנו

הצטרף לניוזלטר שלנו לקבלת טיפים טכניים, ביקורות, ספרים אלקטרוניים בחינם ומבצעים בלעדיים!

לחץ כאן כדי להירשם