目錄
Toggle介紹
在這篇教學中,我們將詳細介紹如何使用 Python 讀取 Excel 文件。Python 有多個強大的庫可以用來操作 Excel 文件,我們將主要介紹最常用的 pandas
與 openpyxl
庫。這些工具可以協助我們高效地讀取、寫入以及操作 Excel 文件中的數據。
安裝必要的庫
在開始之前,我們需要先安裝一些必需的 Python 庫。打開你的命令提示符或終端,執行以下命令:
pip install pandas openpyxl
這將安裝 pandas
以及它的依賴庫 openpyxl
。
使用 Pandas 讀取 Excel 文件
pandas
是一個強大的數據處理工具,它可以非常方便地讀取和分析 Excel 文件中的數據。
讀取 Excel 文件到 DataFrame
首先,我們需要導入 pandas
並使用 read_excel
函數來讀取 Excel 文件。以下是示例代碼:
import pandas as pd
# 讀取 Excel 文件
df = pd.read_excel('example.xlsx')
# 顯示前五行數據
print(df.head())
在這段代碼中,pd.read_excel()
將指定的 Excel 文件讀取為一個 DataFrame
,並使用 df.head()
顯示前五行數據。
選擇特定工作表
如果 Excel 文件中有多個工作表,我們可以使用 sheet_name
參數指定要讀取的工作表。例如:
# 讀取名為 'Sheet2' 的工作表
df = pd.read_excel('example.xlsx', sheet_name='Sheet2')
讀取特定範圍的數據
我們還可以只讀取指定範圍的數據。例如,僅讀取前 10 行數據:
# 讀取前 10 行數據
df = pd.read_excel('example.xlsx').head(10)
使用 openpyxl 讀取 Excel 文件
在某些情況下,我們可能需要更底層的控制,例如讀取和修改 Excel 文件的格式和樣式,這時 openpyxl
會是更好的選擇。
讀取 Excel 文件的基本示例
以下是使用 openpyxl
讀取 Excel 文件的基本方法:
from openpyxl import load_workbook
# 讀取 Excel 文件
workbook = load_workbook(filename='example.xlsx')
sheet = workbook.active
# 顯示 A1 單元格的值
print(sheet['A1'].value)
在這段代碼中,load_workbook
函數打開 Excel 文件,workbook.active
讓我們訪問活動工作表,然後可以使用 sheet['A1'].value
語法讀取指定單元格的值。
迭代工作表中的所有行
我們可以迭代工作表中的所有行,並訪問每個單元格的值。以下是示例代碼:
# 迭代所有行
for row in sheet.iter_rows(values_only=True):
print(row)
這段代碼會逐行打印整個工作表的內容。
結論
這篇教學介紹了如何使用 Python 對 Excel 文件進行讀取操作。我們探討了使用 pandas
和 openpyxl
這兩個庫的一些基本操作。根據你的需求,你可以選擇合適的庫來處理 Excel 文件的讀取、寫入和數據處理任務。