פנדות קריאה וכתיבה של קבצי אקסל – Finxter

Share on facebook
Share on twitter
Share on linkedin
Share on telegram
Share on whatsapp
Share on email
פרסומת
MAGNEZIX מגנזיקס


במהלך הקריירה שלך כמדען נתונים, עשויים להיות מקרים שבהם תעבוד עם נתונים אל/מ DataFrame ל אקסל קוֹבֶץ. מאמר זה מראה לך כיצד לתפעל נתונים אלה באמצעות הפונקציות שלמעלה.

מאמר זה מכסה את הפרמטרים הנפוצים עבור כל פונקציה הרשומה למעלה. לרשימה מלאה של כל הפרמטרים והשימוש בהם, לחץ פה.

הערה: מאמר זה מניח זאת לְהִצטַיֵן שוכן על המחשב.

מתחילים

לפני מניפולציה כלשהי של נתונים, pandas ידרוש התקנה. ספריה זו מאפשרת גישה אל/מ-DataFrame.

ל להתקין את הספרייה הזו, נווט למסוף IDE. בשורת הפקודה ($), הפעל את הקוד למטה. עבור הטרמינל המשמש בדוגמה זו, שורת הפקודה היא סימן דולר ($). ייתכן שבקשת הטרמינל שלך תהיה שונה.

$ pip install pandas

לחץ על <Enter> מקש במקלדת כדי להתחיל בתהליך ההתקנה.

אם ההתקנה הצליחה, תופיע הודעה בטרמינל המציינת זאת.

אנו מניחים שהשורה הראשונה של כל קטע קוד מכילה את הצהרת הייבוא ​​הבאה:

import pandas as pd

קרא את קובץ אקסל

מתאר פונקציה

pandas.read_excel(io, sheet_name=0, header=0, names=None, 
                  index_col=None, usecols=None, squeeze=False, 
                  dtype=None, engine=None, converters=None, 
                  true_values=None, false_values=None, skiprows=None, 
                  nrows=None, na_values=None, keep_default_na=True, 
                  na_filter=True, verbose=False, parse_dates=False, 
                  date_parser=None, thousands=None, comment=None, 
                  skipfooter=0, convert_float=None, 
                  mangle_dupe_cols=True, storage_options=None)

ה read_excel() הפונקציה קוראת an לְהִצטַיֵן קובץ לתוך פנדה DataFrame.

עבור דוגמה זו, נשמור את א רשימה של ה נוסעי מחלקה 2 של טיטאניק ל לְהִצטַיֵן. כדי להמשיך, בצע את השלבים הבאים.

  • נווט ל https://titanicfacts.net/titanic-passenger-list/#2ndclass.
  • הדגש את ה נוסע מחלקה 2 רשימה (כולל שורת הכותרת).
  • ללחוץ CTRL+C כדי להעתיק את האזור המודגש ללוח המערכת.
  • פתח את אקסל.
  • לחץ בתוך A1 תָא.
  • ללחוץ CTRL+V כדי להדביק את התוכן של לוח המערכת ל- גיליון עבודה של אקסל.
  • תשמור את לְהִצטַיֵן קובץ בשם titanic.xlsx ומקם את הקובץ הזה בספריית העבודה הנוכחית.

להלן השורות הראשונות של הקובץ.

כדי לקרוא את הקובץ הזה לתוך א DataFrame, הפעל את הקוד הבא.

df = pd.read_excel('titanic.xlsx')
print(df.head(4))
  • קַו [2] קורא ב titanic.xlsx קובץ שנוצר קודם לכן.
  • קַו [3] מפלט חמש שורות: שורת כותרת אחת וארבע שורות נתונים למסוף.

תְפוּקָה

שֵׁם מִשׁפָּחָה שמות פרטיים גיל עלה לסיפון שורד (S) או קורבן (†)
0 אבלסון מר סמואל 30 שרבורג
1 אבלסון גברת חנה 28 שרבורג ס
2 אלדוורת' מר אוגוסטוס הנרי 34 סאות'המפטון
3 אנדרו מר פרנק תומאס 25 סאות'המפטון

הערות

  • כדי להסתיר את עמודת האינדקס (העמודה השמאלית ביותר למעלה), הגדר את index_col פרמטר כדלקמן:
df = pd.read_excel('titanic.xlsx', index_col=0)
שֵׁם מִשׁפָּחָה שמות פרטיים גיל עלה לסיפון שורד (S) או קורבן (†)
אבלסון מר סמואל 30 שרבורג
אבלסון גברת חנה 28 שרבורג ס
אלדוורת' מר אוגוסטוס הנרי 34 סאות'המפטון
אנדרו מר פרנק תומאס 25 סאות'המפטון
  • כדי לשנות את שורת הכותרת שם למספר, הגדר את header פרמטר כדלקמן:
df = pd.read_excel('titanic.xlsx', header=None)
0 1 2 3 4
0 אבלסון מר סמואל 30 שרבורג
1 אבלסון גברת חנה 28 שרבורג ס
2 אלדוורת' מר אוגוסטוס הנרי 34 סאות'המפטון
3 אנדרו מר פרנק תומאס 25 סאות'המפטון

לקבלת רשימה של פרמטרים זמינים עבור פונקציה זו, לחץ פה.

DataFrame לאקסל

מתאר פונקציה

DataFrame.to_excel(excel_writer, sheet_name="Sheet1", na_rep='', 
                   float_format=None, columns=None, header=True, 
                   index=True, index_label=None, startrow=0, 
                   startcol=0, engine=None, merge_cells=True, 
                   encoding=None, inf_rep='inf', verbose=True, 
                   freeze_panes=None, storage_options=None)

ה to_excel() פונקציה כותבת א DataFrame לגיליון עבודה של אקסל.

עבור דוגמה זו, חדש לְהִצטַיֵן הקובץ יוצא מהקובץ המקורי עם כמה הבדלים.

df = pd.read_excel('titanic.xlsx')
cols = ['Surname', 'First Names', 'Age']
df.to_excel('titanic1.xlsx', sheet_name="Sheet1", columns=cols, freeze_panes=(1,4))
  • קַו [2] קורא ב titanic.xlsx קובץ שנוצר קודם לכן.
  • קַו [3] יוצר רשימה עם העמודות שאנו רוצים בקובץ האקסל החדש.
  • קַו [4] שומר חדש לְהִצטַיֵן קובץ עם האפשרויות הבאות:
    • מציין את גליון העבודה לקריאה (אופציונלי).
    • מגדיר את העמודות להצגה (ראה רשימת עמודות בשורה [3]).
    • מקפיא את השורה הראשונה, ארבע עמודות (חלונית).

תְפוּקָה:

להלן השורות הראשונות של הקובץ. נסה לגלול כדי לוודא שאפשרות החלונית ההקפאה עבדה.

לקבלת רשימה של פרמטרים זמינים עבור פונקציה זו, לחץ פה.

Excel Styler ו-Excel Writer

מתאר פונקציה

Styler.to_excel(excel_writer, sheet_name="Sheet1", na_rep='', 
                float_format=None, columns=None, header=True, 
                index=True, index_label=None, startrow=0, startcol=0, 
                engine=None, merge_cells=True, encoding=None, 
                inf_rep='inf', verbose=True, freeze_panes=None)

פונקציה זו כותבת סגנונות לגליון עבודה של Excel.

class pandas.ExcelWriter(path, engine=None, date_format=None, 
                         datetime_format=None, mode="w", 
                         storage_options=None, if_sheet_exists=None, 
                         engine_kwargs=None, **kwargs)

פונקציה זו היא מחלקה לכתיבת DataFrame לגיליון עבודה של Excel.

עבור דוגמה זו, ניצור א מילון של עובדי חברת סטארט-אפ קטנה בתחום ה-IT. הפעל את הקוד הבא כדי ליצור קובץ אקסל חדש, salaries.xlsx.

import pandas as pd
df = pd.DataFrame({'Fname':     ['Anne', 'Mark', 'Paul', 'Ben', 'Micah'],
                 		'Salaries':   [98273,  84900,  120876, 52759, 99767],
                   		'Profit':       [.15,    .23,     .8 ,    .7,    .3]})

xw = pd.ExcelWriter("salaries.xlsx", engine="xlsxwriter")
df.to_excel(xw, sheet_name="Sheet1")

workbook  = xw.book
worksheet = xw.sheets['Sheet1']

sal = workbook.add_format({'num_format': '$#,##0.00'})
pro = workbook.add_format({'num_format': '0%'})

worksheet.set_column('B:B', 15)
worksheet.set_column('C:C', 25, sal)
worksheet.set_column('D:D', 26, pro)
xw.save()
  • קַו [2] יוצר DataFrame חדש: מילון של רשימות.
  • קַו [3-4] מגדיר את קובץ ה-Excel, את המנוע לשימוש ואת גליון העבודה.
  • קַו [5-6] מקצה את חוברת העבודה וגליון העבודה.
  • קַו [7-8] מגדיר את העיצוב עבור Salaries ו Profit שדות.
  • קַו [9-11] מגדיר את הרוחב של כל עמודה ואת הסגנונות במידת הצורך.
  • קַו [12] שומר את קובץ האקסל החדש.

תְפוּקָה:

לקבלת רשימה של פרמטרים זמינים עבור פונקציות אלה, לחץ פה.



קישור לכתבת המקור – 2021-11-24 13:23:59

Share on facebook
Facebook
Share on twitter
Twitter
Share on linkedin
LinkedIn
Share on telegram
Telegram
Share on whatsapp
WhatsApp
Share on email
Email
פרסומת
MAGNEZIX מגנזיקס

עוד מתחומי האתר