简介:df.loc()是Pandas库中用于数据查询的重要方法之一,它基于标签进行数据选择。本文将详细介绍df.loc()的用法和特点,帮助你更好地理解和使用这个强大的工具。
在Pandas库中,df.loc[]是一个非常实用的数据查询方法,它允许我们基于标签选择数据。相比于其他数据查询方法,df.loc()具有以下特点:
在上面的示例中,我们首先创建了一个包含姓名、年龄和薪水的简单DataFrame。然后,使用df.loc()选择第2行到第3行(不包括第3行)以及’Name’和’Salary’列的数据。最后,打印出所选数据。
import pandas as pd# 创建一个简单的DataFramedata = {'Name': ['Alice', 'Bob', 'Charlie', 'David'],'Age': [25, 30, 35, 40],'Salary': [50000, 60000, 70000, 80000]}df = pd.DataFrame(data)# 使用df.loc()选择特定行和列的数据selected_data = df.loc[1:3, ['Name', 'Salary']]print(selected_data)
在上面的示例中,我们使用布尔条件
# 选择年龄大于30岁的员工信息older_employees = df.loc[df['Age'] > 30]print(older_employees)
df['Age'] > 30来过滤出年龄大于30岁的员工信息。然后,打印出满足条件的所有行。