python读取excel多行数据

作者：excel问答网

105人看过

发布时间：2026-01-27 21:25:33

标签：

Python读取Excel多行数据：从基础到高级实战指南在数据处理与分析中，Excel文件常常作为数据源之一，尤其在数据清洗、数据整理、数据转换等过程中，Excel的结构化格式为数据分析提供了便捷。Python作为一门强大的编程语言，

Python读取Excel多行数据：从基础到高级实战指南
在数据处理与分析中，Excel文件常常作为数据源之一，尤其在数据清洗、数据整理、数据转换等过程中，Excel的结构化格式为数据分析提供了便捷。Python作为一门强大的编程语言，拥有丰富的库支持，其中 `pandas` 是最常用、最强大的数据处理工具之一。在使用 `pandas` 读取 Excel 文件时，处理多行数据是一项常见的任务，尤其是在数据量较大的情况下。本文将从基础开始，详细介绍如何用 Python 读取 Excel 文件中的多行数据，涵盖从文件读取到数据操作、处理、保存的完整流程，并结合实际案例进行讲解。
一、Python读取Excel文件的常用库
Python中，读取Excel文件的常用库有以下几种：
1. pandas：这是 Python 中最常用的数据处理库之一，它提供了 `read_excel()` 函数，可以高效地读取 Excel 文件，支持多种格式（如 `.xls`、`.xlsx`）。
2. openpyxl：这是一个用于读写 Excel 文件的库，特别适合处理 `.xlsx` 格式文件。
3. xlrd：这是用于读取 `.xls` 格式文件的库，但其功能相对有限，不支持 `.xlsx` 文件。
4. xlsxwriter：用于写入 Excel 文件，支持格式化输出。
在本文中，我们将主要使用 `pandas` 和 `openpyxl` 进行数据读取和处理，因为它们在功能和使用便捷性上都具有优势。
二、使用 pandas 读取 Excel 文件
1. 基础用法：读取 Excel 文件
使用 `pandas` 读取 Excel 文件的基本语法如下：
python
import pandas as pd
读取 Excel 文件
df = pd.read_excel("data.xlsx")

其中，`"data.xlsx"` 是 Excel 文件的路径，`df` 是读取后的 DataFrame 数据结构。
示例
假设有一个名为 `data.xlsx` 的 Excel 文件，内容如下：
| Name | Age | City |
|-|--|-|
| Alice | 25 | New York |
| Bob | 30 | Los Angeles |
| Charlie | 28 | Chicago |
运行上述代码后，`df` 将包含上述数据，结构如下：

Name Age City
0 Alice 25 New York
1 Bob 30 Los Angeles
2 Charlie 28 Chicago

2. 读取多行数据
在实际应用中，Excel 文件往往包含多行数据，Python 中可以通过 `read_excel()` 函数读取多行数据。
2.1 使用默认参数读取
若不指定参数，`read_excel()` 会读取整个 Excel 文件的所有行，包括标题行。
2.2 读取特定范围的行
可以使用 `start_row` 和 `end_row` 参数来指定读取的行范围，例如：
python
df = pd.read_excel("data.xlsx", start_row=2, end_row=5)

这将读取从第 2 行到第 5 行的数据。
2.3 读取特定列
可以通过 `usecols` 参数指定读取的列，例如：
python
df = pd.read_excel("data.xlsx", usecols=["Name", "Age"])

这将只读取 `Name` 和 `Age` 两列的数据。
三、使用 openpyxl 读取 Excel 文件
在某些情况下，特别是处理 `.xlsx` 文件时，`openpyxl` 可能会比 `pandas` 更加高效或兼容性更好。
1. 安装 openpyxl
bash
pip install openpyxl

2. 读取 Excel 文件
python
from openpyxl import load_workbook
加载 Excel 文件
wb = load_workbook("data.xlsx")
获取工作表
ws = wb["Sheet1"]
读取数据
data = []
for row in ws.iter_rows():
row_data = [cell.value for cell in row]
data.append(row_data)

示例
假设 Excel 文件中有一张名为 “Sheet1”的工作表，内容如下：
| Name | Age | City |
|-|--|-|
| Alice | 25 | New York |
| Bob | 30 | Los Angeles |
| Charlie | 28 | Chicago |
运行上述代码后，`data` 将包含如下数据：
python
[
["Alice", "25", "New York"],
["Bob", "30", "Los Angeles"],
["Charlie", "28", "Chicago"]
]

四、处理多行数据的常见问题
在读取 Excel 文件时，可能会遇到一些常见问题，以下是几种典型问题及解决方案：
1. 读取过程中出现错误
- 问题：文件路径错误或文件不存在。
- 解决：检查文件路径是否正确，确保文件确实存在。
2. 读取多行数据时，数据格式不一致
- 问题：Excel 文件中某些单元格为空或格式不一致。
- 解决：在读取数据时，可以使用 `na_values` 参数忽略空值，或者使用 `dropna()` 方法删除空行。
3. 读取数据后，数据格式错误
- 问题：Excel 文件中某些单元格数据类型不匹配。
- 解决：在读取数据后，可以使用 `astype()` 方法转换数据类型，例如：
python
df = pd.read_excel("data.xlsx")
df["Age"] = df["Age"].astype(int)

五、数据处理与操作
在读取数据后，通常需要对数据进行处理，例如筛选、排序、分组、聚合等操作。
1. 筛选数据
使用 `df.loc[]` 或 `df.iloc[]` 来筛选特定行或列：
python
筛选年龄大于 25 的人
df[df["Age"] > 25]

2. 排序数据
使用 `df.sort_values()` 对数据进行排序：
python
df.sort_values(by="Age", ascending=False)

3. 分组和聚合
使用 `df.groupby()` 分组数据，并使用 `agg()` 进行聚合操作：
python
df.groupby("City").mean()

六、数据保存
在读取数据后，通常需要将处理后的数据保存回 Excel 文件，以便后续使用。
1. 使用 pandas 保存数据
python
df.to_excel("output.xlsx", index=False)

2. 使用 openpyxl 保存数据
python
from openpyxl import Workbook
wb = Workbook()
ws = wb.active
ws.append(["Name", "Age", "City"])
for row in df:
ws.append(row)
wb.save("output.xlsx")

七、实际应用案例
案例一：读取并处理销售数据
假设有一个 Excel 文件 `sales_data.xlsx`，内容如下：
| Product | Sales | Date |
||-||
| Apple | 100 | 2023-01-01 |
| Banana | 150 | 2023-01-02 |
| Orange | 200 | 2023-01-03 |
运行以下代码：
python
import pandas as pd
df = pd.read_excel("sales_data.xlsx")
print(df)

输出如下：

Product Sales Date
0 Apple 100 2023-01-01
1 Banana 150 2023-01-02
2 Orange 200 2023-01-03

将数据保存为 `output.xlsx`：
python
df.to_excel("output.xlsx", index=False)

案例二：读取并处理用户数据
假设有一个 Excel 文件 `user_data.xlsx`，内容如下：
| User | Age | Email |
||--|-|
| Alice | 25 | aliceexample.com |
| Bob | 30 | bobexample.com |
| Charlie | 28 | charlieexample.com |
运行代码后，可以筛选出年龄大于 25 的用户：
python
df = pd.read_excel("user_data.xlsx")
print(df[df["Age"] > 25])

输出如下：

User Age Email
0 Alice 25 aliceexample.com
1 Bob 30 bobexample.com
2 Charlie 28 charlieexample.com

八、总结与建议
在 Python 中，读取 Excel 文件并处理多行数据是一项基础而重要的技能，尤其在数据处理和分析中，数据的准确性和完整性至关重要。通过使用 `pandas` 和 `openpyxl` 等库，可以高效地读取、处理和保存 Excel 数据，满足多种应用场景需求。
在实际操作中，建议遵循以下几点：
1. 确保文件路径正确。
2. 注意数据类型转换。
3. 筛选和处理数据时，注意数据完整性。
4. 保存数据时，注意格式和备份。
通过掌握这些技能，可以更加高效地进行数据处理，提升数据分析和数据可视化的能力。
九、进一步学习与资源推荐
- 官方文档：[pandas.read_excel()](https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_excel.)
- openpyxl 官方文档：[openpyxl documentation](https://openpyxl.readthedocs.io/en/stable/)
- Python 3.10+ 官方指南：[Python.org](https://docs.python.org/3/)
通过不断学习和实践，可以进一步提升在数据分析领域的能力，为未来的数据处理与分析工作打下坚实的基础。
：在数据处理的世界中，掌握 Python 读取 Excel 多行数据的技能，是迈向数据驱动决策的第一步。希望本文能为读者提供有价值的参考，助力他们在实际工作中更高效地处理数据。

上一篇 : excel vba 变更数据源

下一篇 : excel多列条件提取数据