Pandas 基础练习题:从数据到答案

作者:菠萝爱吃肉2024.01.17 20:53浏览量:4

简介:通过9道Pandas基础练习题,掌握数据清洗、筛选、处理和分析的技巧。每道题目附有数据,并提供详细答案解释。

在数据处理和分析中,Pandas是一个非常强大的工具。通过以下9道练习题,你将深入了解Pandas的基础操作,包括数据清洗、筛选、处理和分析。每道题目附有数据和答案,帮助你更好地理解Pandas的用法。
题目1:数据清洗
假设你有一个包含以下数据的DataFrame:

  1. import pandas as pd
  2. data = {
  3. '姓名': ['张三', '李四', '王五', '赵六'],
  4. '年龄': [25, 30, 35, 40],
  5. '性别': ['男', '男', '女', '男'],
  6. '收入': [50000, 60000, 70000, 80000]
  7. }
  8. df = pd.DataFrame(data)

其中有些数据存在缺失值,需要进行清洗。请使用Pandas清洗缺失值,并将缺失值替换为平均值。
答案及解析:
首先,使用isnull()函数找出缺失值。然后,使用fillna()函数将缺失值替换为平均值。以下是答案代码:

  1. # 找出缺失值
  2. missing_values = df.isnull()
  3. # 计算平均值并替换缺失值
  4. df.fillna(df.mean(), inplace=True)

题目2:数据筛选
筛选出上题中年龄大于30岁的数据。
答案及解析:
使用Pandas的布尔索引,通过条件筛选出满足年龄大于30岁的数据。以下是答案代码:

  1. filtered_data = df[df['年龄'] > 30]

题目3:数据排序
将上题中筛选出来的数据按照收入从高到低排序。
答案及解析:
使用sort_values()函数按照收入列进行排序,指定ascending=False为降序排序。以下是答案代码:

  1. sorted_data = filtered_data.sort_values(by='收入', ascending=False)