一、使用Pandas库读取Excel文件
Pandas是一个强大的Python数据分析库,能够轻松地处理Excel文件。使用pandas读取Excel文件非常简单,只需几行代码即可。
1、安装pandas库
pip install pandas
2、读取excel文件
import pandas as pd
df = pd.read_excel('xx.xlsx') ##pd.read_excel函数用来读取Excel文件,并将其存储在一个DataFrame对象中。
3、遍历每一行
for index, row in df.iterrows(): ##df.iterrows()方法用于遍历DataFrame的每一行,row表示当前行的内容。
print(row)
4、pandas库读取excel文件的优势
- 自动处理数据类型: Pandas会自动将Excel中的数据转换为合适的Python数据类型。
- 丰富的数据操作功能: Pandas提供了许多强大的数据操作函数,可以方便地对数据进行过滤、排序、分组等操作。
- 良好的性能: Pandas基于NumPy库,具有很高的性能,能够高效地处理大型Excel文件。
二、使用Openpyxl库读取Excel文件
Openpyxl是一个专门用于处理Excel文件的Python库,支持Excel 2010及以上版本的xlsx格式文件。
1、安装openpyxl库
pip install openpyxl
2、读取excel文件
from openpyxl import load_workbook
wb = load_workbook('xx.xlsx') ##函数用于读取Excel文件
sheet = wb.active ##用于获取当前活动的工作表
3、遍历每一行
for row in sheet.iter_rows(values_only=True): ##方法用于遍历工作表的每一行
print(row) ##表示当前行的内容
df_cleaned = df.dropna() # 删除包含空值的行df_filled = df.fillna(0) # 用0填充
df_specific_columns = pd.read_excel('文件路径.xlsx', usecols=['列名1', '列名2']) # 读取特定列
df_specific_rows = df.iloc[0:5] # 读取前五行
4、pandas库读取excel文件的优势
- 全面的Excel功能支持: Openpyxl适用于处理Excel 2010及以上版本的xlsx格式文件,提供了许多高级功能,适合需要对Excel文件进行复杂操作的场景;支持Excel的许多高级功能,如图表、公式、样式等。
- 灵活的操作: Openpyxl提供了许多灵活的操作函数,可以方便地对Excel文件进行读写操作。
三、使用Xlrd库读取Excel文件
1、安装xlrdl库
pip install xlrd
2、读取excel文件
import xlrd
wordbook = xlrd.open_workbook('xx.xls') ##函数用于读取Excel文件
sheet = workbook.sheet_by_index(0) ##函数用于获取工作表
3、遍历每一行
for row_idx in range(sheet.nrows): ##sheet.nrows表示工作表的总行数
row = sheet.row(row_idx) ##用于获取指定行的内容
print(row)
4、xlrd库读取excel文件的优势
- 支持旧版Excel文件: Xlrd库专门用于处理Excel 97-2003格式的xls文件。
- 简单易用: Xlrd库提供了简单的API,方便用户读取Excel文件。
四、总结
在实际应用中,可以根据具体需求选择合适的方法来读取Excel文件。例如,如果需要处理大量数据并进行复杂的数据分析,推荐使用Pandas库;如果需要处理Excel文件中的图表、公式等高级功能,可以选择Openpyxl库;如果需要处理旧版Excel文件,则可以选择Xlrd库。