目錄
Toggle介紹
Python 提供了多種方式來讀取和處理 Excel 文件。常用的庫包括 pandas
和 openpyxl
。本教程將詳細介紹如何使用這些庫來讀取 Excel 文件,並展示一些實用的操作。
安裝必需套件
在開始讀取 Excel 文件之前,需要安裝一些必需的 Python 庫。這裡我們使用 pandas
和 openpyxl
。可以使用以下命令來安裝這些庫:
pip install pandas openpyxl
使用 pandas 讀取 Excel 文件
讀取 Excel 文件
讀取 Excel 文件非常簡單。以下是基本的讀取方法:
import pandas as pd
# 讀取 Excel 文件
df = pd.read_excel('path_to_your_file.xlsx')
# 顯示讀取的數據
print(df)
以上代碼將讀取名為 path_to_your_file.xlsx
的文件並打印出來。
選擇特定的工作表
如果你的 Excel 文件包含多個工作表,你可以指定想要讀取的工作表名稱或索引:
# 讀取特定工作表
df = pd.read_excel('path_to_your_file.xlsx', sheet_name='Sheet1')
# 或者使用索引
df = pd.read_excel('path_to_your_file.xlsx', sheet_name=0)
處理多個工作表
如果需要處理多個工作表,可以將 sheet_name
參數設為 None
,這樣會返回一個字典,鍵為工作表名,值為相應的 DataFrame:
# 讀取所有工作表
dfs = pd.read_excel('path_to_your_file.xlsx', sheet_name=None)
# 顯示所有工作表的名稱
print(dfs.keys())
# 顯示某一工作表的數據
print(dfs['Sheet1'])
選擇特定的列和行
讀取 Excel 文件後,可以輕易選擇指定的列和行來操作數據。
選擇特定的列:
# 選擇 "column_name" 列
column_data = df['column_name']
print(column_data)
選擇特定的行:
# 選擇第1行
row_data = df.iloc[0]
print(row_data)
使用 openpyxl 讀取 Excel 文件
讀取 Excel 文件
openpyxl
是一個專門處理 Excel 文件的庫。以下是基本的讀取方法:
import openpyxl
# 打開 Excel 文件
workbook = openpyxl.load_workbook('path_to_your_file.xlsx')
# 獲取默認工作表
sheet = workbook.active
# 打印 A1 單元格的值
print(sheet['A1'].value)
選擇特定的工作表
可以使用工作表的名稱來獲取特定工作表:
# 獲取特定工作表
sheet = workbook['Sheet1']
# 打印特定單元格的值
print(sheet['B2'].value)
遍歷所有行和列
可以遍歷整個工作表中的所有行或列來操作數據:
遍歷所有行:
# 遍歷所有行
for row in sheet.iter_rows():
for cell in row:
print(cell.value)
遍歷所有列:
# 遍歷所有列
for column in sheet.iter_cols():
for cell in column:
print(cell.value)
總結
以上介紹了如何使用 pandas
和 openpyxl
讀取 Excel 文件,並簡要展示了如何選擇特定的工作表、行和列。這些功能可以幫助我們更高效地處理 Excel 數據。希望本教程對你學習 Python 操作 Excel 文件有所幫助。