Pandas库中的pd.DataFrame函数:基本用法

作者:公子世无双2024.01.18 05:49浏览量:72

简介:Pandas是Python中用于数据处理和分析的强大库。pd.DataFrame是Pandas库中最重要的函数之一,用于创建和操作数据表。本文将介绍pd.DataFrame的基本用法,包括创建、选择、修改和显示数据等操作。

Pandas库中的pd.DataFrame函数是一个强大的工具,可以方便地处理和分析数据。下面是一些基本的用法和示例。
创建DataFrame
创建一个空的DataFrame对象,可以通过传递一个字典来创建具有列标签的DataFrame。

  1. import pandas as pd
  2. data = {'列1': [1, 2, 3], '列2': [4, 5, 6]}
  3. df = pd.DataFrame(data)

在这个例子中,我们创建了一个包含两列数据的DataFrame,列标签分别为’列1’和’列2’。
选择数据
使用列标签选择特定列的数据。

  1. print(df['列1']) # 输出:列1的数值

也可以使用行标签选择特定的行数据。

  1. print(df.loc[0]) # 输出:第一行的数据

使用布尔索引选择满足条件的行数据。

  1. print(df[df['列1'] > 1]) # 输出:列1大于1的所有行数据

修改数据
修改DataFrame中的数据可以通过直接赋值来实现。

  1. df['列1'][0] = 10 # 将第一行的列1值修改为10

也可以使用loc属性来选择特定的行和列,并直接赋值进行修改。

  1. df.loc[0, '列1'] = 20 # 将第一行的列1值修改为20

添加和删除列
使用assign()方法添加新列。

  1. df = df.assign(新列名=[新列值]) # 将新列添加到DataFrame中

使用drop()方法删除列。
```python
df = df.drop(‘列名’, axis=1) # 删除指定列的DataFrame对象