目錄
Toggle介紹
Openpyxl 是一個用於讀取和寫入 Excel 文件的強大 Python 庫。這篇教學將著重介紹如何使用 openpyxl 來讀取 Excel 文件中的資料。無論你是需要一次性讀取整個工作簿,還是只需特定的資料,我們都會在這裡詳細解說。
安裝 openpyxl
在開始使用 openpyxl 之前,你需要先安裝這個庫。如果你還未安裝,可以使用以下指令:
pip install openpyxl
基本操作
讀取 Excel 文件
首先,我們需要載入位於指定路徑的 Excel 文件。以下是最基本的讀取操作:
from openpyxl import load_workbook
# 指定 Excel 文件的路徑
file_path = 'example.xlsx'
# 使用 load_workbook 方法讀取工作簿
wb = load_workbook(file_path)
# 選擇你要操作的工作表
sheet = wb.active
print(sheet.title)
以上例子讀取了一個名為 example.xlsx 的文件,然後選取了活躍的工作表並打印其標題。
讀取單元格數據
讀取單元格數據是相對簡單的操作。你可以使用行和列編號來指定單元格:
# 讀取 A1 單元格
cell_value = sheet['A1'].value
# 讀取指定行列的單元格,如第2行、第1列
cell_value_by_row_col = sheet.cell(row=2, column=1).value
print(cell_value)
print(cell_value_by_row_col)
這些方法將返回指定單元格內的數據,無論是文字、數字還是其他格式。
高級操作
迭代行和列
當需要讀取大量數據時,你可以選擇迭代行或列:
# 迭代所有行
for row in sheet.iter_rows():
for cell in row:
print(cell.value)
# 迭代所有列
for col in sheet.iter_cols():
for cell in col:
print(cell.value)
這樣可以更靈活地處理和分析大型資料集。
範圍讀取
在處理大量資料時,僅需讀取特定範圍內的數據也非常有用:
# 讀取範圍 A1:C2
for row in sheet['A1:C2']:
for cell in row:
print(cell.value)
這將只返回指定範圍內的數據。
其他有用技巧
獲取表格所有工作表名稱
如果你需要在多個工作表之間進行操作,你可以輕鬆獲取它們的名稱:
# 獲取所有工作表名稱
sheet_names = wb.sheetnames
print(sheet_names)
選擇特定的工作表
在讀取工作簿後,可以輕易地選擇特定的工作表進行操作:
# 選擇名為 'Sheet2' 的工作表
specific_sheet = wb['Sheet2']
print(specific_sheet.title)
結論
openpyxl 提供了強大的功能來讀取和操作 Excel 文件。無論是簡單的數據讀取,還是需要高級操作,本教學涵蓋了基本用法及一些高級技巧。希望這篇教學對你有所幫助!