Pandas DataFrame基本操作指南(一)

作者:沙与沫2024.03.22 17:23浏览量:11

简介:本文将带你了解Pandas库中DataFrame对象的基本操作,包括创建、索引、切片、筛选、排序、数据变换等,帮助你快速掌握DataFrame的核心功能。

Pandas DataFrame基本操作指南(一)

Pandas是一个强大的Python数据分析库,而DataFrame是Pandas中最核心的数据结构,它类似于Excel中的表格或SQL中的表。本文将带你了解DataFrame对象的基本操作,帮助你快速掌握其核心功能。

一、创建DataFrame

首先,我们需要导入Pandas库,并使用DataFrame函数来创建一个DataFrame对象。

  1. import pandas as pd
  2. # 使用字典创建DataFrame
  3. data = {
  4. 'Name': ['Alice', 'Bob', 'Charlie'],
  5. 'Age': [25, 30, 35],
  6. 'Salary': [50000, 60000, 70000]
  7. }
  8. df = pd.DataFrame(data)
  9. print(df)

二、索引和切片

DataFrame支持行索引和列索引,可以通过lociloc来访问特定位置的元素。

  1. # 使用loc访问特定行和列
  2. print(df.loc[0, 'Name']) # Alice
  3. # 使用iloc访问特定位置的行和列
  4. print(df.iloc[1, 1]) # 30
  5. # 切片操作
  6. print(df.loc[1:3, 'Name']) # Bob Bob
  7. # Charlie Charlie
  8. # Name: Name, dtype: object
  9. print(df.iloc[1:3, 1:3])
  10. # Age Salary
  11. # 1 30 60000
  12. # 2 35 70000

三、筛选数据

DataFrame提供了多种筛选数据的方法,如布尔索引、条件筛选等。

  1. # 布尔索引
  2. print(df[df['Age'] > 30])
  3. # Name Age Salary
  4. # 2 Charlie 35 70000
  5. # 条件筛选
  6. print(df.query('Age > 28'))
  7. # Name Age Salary
  8. # 1 Bob 30 60000
  9. # 2 Charlie 35 70000

四、排序

DataFrame支持按照某列或多列进行排序。

  1. # 按照Age列升序排序
  2. print(df.sort_values('Age'))
  3. # 按照Age列降序排序
  4. print(df.sort_values('Age', ascending=False))
  5. # 按照多列排序
  6. print(df.sort_values(by=['Age', 'Salary'], ascending=[True, False]))

五、数据变换

Pandas提供了丰富的数据变换功能,如数据清洗、数据转换等。

  1. # 数据清洗:删除空值
  2. print(df.dropna())
  3. # 数据转换:添加新列
  4. df['Bonus'] = df['Salary'] * 0.1
  5. print(df)

这只是Pandas DataFrame的基本操作指南的第一部分,后续我们还会深入探讨DataFrame的高级功能和优化技巧。希望本文能帮助你快速掌握DataFrame的核心功能,为你的数据分析之旅打下坚实的基础。