简介:通过9道Pandas基础练习题,掌握数据清洗、筛选、处理和分析的技巧。每道题目附有数据,并提供详细答案解释。
在数据处理和分析中,Pandas是一个非常强大的工具。通过以下9道练习题,你将深入了解Pandas的基础操作,包括数据清洗、筛选、处理和分析。每道题目附有数据和答案,帮助你更好地理解Pandas的用法。
题目1:数据清洗
假设你有一个包含以下数据的DataFrame:
import pandas as pddata = {'姓名': ['张三', '李四', '王五', '赵六'],'年龄': [25, 30, 35, 40],'性别': ['男', '男', '女', '男'],'收入': [50000, 60000, 70000, 80000]}df = pd.DataFrame(data)
其中有些数据存在缺失值,需要进行清洗。请使用Pandas清洗缺失值,并将缺失值替换为平均值。
答案及解析:
首先,使用isnull()函数找出缺失值。然后,使用fillna()函数将缺失值替换为平均值。以下是答案代码:
# 找出缺失值missing_values = df.isnull()# 计算平均值并替换缺失值df.fillna(df.mean(), inplace=True)
题目2:数据筛选
筛选出上题中年龄大于30岁的数据。
答案及解析:
使用Pandas的布尔索引,通过条件筛选出满足年龄大于30岁的数据。以下是答案代码:
filtered_data = df[df['年龄'] > 30]
题目3:数据排序
将上题中筛选出来的数据按照收入从高到低排序。
答案及解析:
使用sort_values()函数按照收入列进行排序,指定ascending=False为降序排序。以下是答案代码:
sorted_data = filtered_data.sort_values(by='收入', ascending=False)