Pandas库中的pd.DataFrame函数：基本用法

简介：Pandas是Python中用于数据处理和分析的强大库。pd.DataFrame是Pandas库中最重要的函数之一，用于创建和操作数据表。本文将介绍pd.DataFrame的基本用法，包括创建、选择、修改和显示数据等操作。

Pandas库中的pd.DataFrame函数是一个强大的工具，可以方便地处理和分析数据。下面是一些基本的用法和示例。
创建DataFrame
创建一个空的DataFrame对象，可以通过传递一个字典来创建具有列标签的DataFrame。

import pandas as pd
data = {'列1': [1, 2, 3], '列2': [4, 5, 6]}
df = pd.DataFrame(data)

在这个例子中，我们创建了一个包含两列数据的DataFrame，列标签分别为’列1’和’列2’。
选择数据
使用列标签选择特定列的数据。

print(df['列1'])  # 输出：列1的数值

也可以使用行标签选择特定的行数据。

print(df.loc[0])  # 输出：第一行的数据

使用布尔索引选择满足条件的行数据。

print(df[df['列1'] > 1])  # 输出：列1大于1的所有行数据

修改数据
修改DataFrame中的数据可以通过直接赋值来实现。

df['列1'][0] = 10  # 将第一行的列1值修改为10

也可以使用loc属性来选择特定的行和列，并直接赋值进行修改。

df.loc[0, '列1'] = 20  # 将第一行的列1值修改为20

添加和删除列
使用assign()方法添加新列。

df = df.assign(新列名=[新列值])  # 将新列添加到DataFrame中

使用drop()方法删除列。
```python
df = df.drop(‘列名’, axis=1) # 删除指定列的DataFrame对象