searchusermenu
  • 发布文章
  • 消息中心
点赞
收藏
评论
分享
原创

Python处理表格数据的10个实用脚本(3)

2024-11-22 09:35:03
4
0

数据聚合

数据聚合允许我们对数据进行分组并计算统计信息,如求平均值、总和等。

生活例子

假设你有多个地区的水果销售数据,希望计算每种水果的总销售量。

import pandas as pd

# 示例数据
data = {
    'Region': ['North', 'South', 'North', 'South'],
    'Fruit': ['Apple', 'Apple', 'Banana', 'Banana'],
    'Sales': [100, 200, 300, 150]
}
df = pd.DataFrame(data)

# 按水果类型分组并计算总销量
total_sales = df.groupby('Fruit')['Sales'].sum()

# 查看结果
print(total_sales)

代码说明

  • df.groupby('Fruit')['Sales'].sum():根据水果类型进行分组,并计算每种水果的总销售量。

处理缺失值

在数据集中,缺失值是常见的问题。Pandas 提供了多种方法来处理这些缺失值。

如果在你的销售数据中,有些水果的销售量缺失,你可能想要删除这些记录。

import pandas as pd

# 读取 CSV 文件
data = pd.read_csv('fruits.csv')

# 查看缺失值情况
print(data.isnull().sum())

# 删除含有缺失值的行
cleaned_data = data.dropna()

# 查看处理后的数据
print(cleaned_data)

代码说明

  • data.isnull().sum():检查每列的缺失值数量。

  • data.dropna():删除含有缺失值的行。

0条评论
0 / 1000
王****际
180文章数
2粉丝数
王****际
180 文章 | 2 粉丝
原创

Python处理表格数据的10个实用脚本(3)

2024-11-22 09:35:03
4
0

数据聚合

数据聚合允许我们对数据进行分组并计算统计信息,如求平均值、总和等。

生活例子

假设你有多个地区的水果销售数据,希望计算每种水果的总销售量。

import pandas as pd

# 示例数据
data = {
    'Region': ['North', 'South', 'North', 'South'],
    'Fruit': ['Apple', 'Apple', 'Banana', 'Banana'],
    'Sales': [100, 200, 300, 150]
}
df = pd.DataFrame(data)

# 按水果类型分组并计算总销量
total_sales = df.groupby('Fruit')['Sales'].sum()

# 查看结果
print(total_sales)

代码说明

  • df.groupby('Fruit')['Sales'].sum():根据水果类型进行分组,并计算每种水果的总销售量。

处理缺失值

在数据集中,缺失值是常见的问题。Pandas 提供了多种方法来处理这些缺失值。

如果在你的销售数据中,有些水果的销售量缺失,你可能想要删除这些记录。

import pandas as pd

# 读取 CSV 文件
data = pd.read_csv('fruits.csv')

# 查看缺失值情况
print(data.isnull().sum())

# 删除含有缺失值的行
cleaned_data = data.dropna()

# 查看处理后的数据
print(cleaned_data)

代码说明

  • data.isnull().sum():检查每列的缺失值数量。

  • data.dropna():删除含有缺失值的行。

文章来自个人专栏
文章 | 订阅
0条评论
0 / 1000
请输入你的评论
0
0