使用pandas的loc和iloc读取行数据和列数据

作者:起个名字好难2024.01.17 20:59浏览量:25

简介:pandas是一个强大的Python数据分析库,它提供了多种方法来读取和处理数据。其中,loc和iloc是两种常用的方法,用于选择数据框(DataFrame)中的行和列。本文将详细介绍如何使用这两种方法来读取行数据和列数据。

在pandas中,DataFrame是一个二维标签化的数据结构,可以存储不同类型的数据,并具有行标签和列标签。为了方便地选择数据,pandas提供了多种方法,其中最常用的就是loc和iloc。
1. 使用loc读取行数据
loc方法通过标签来选择行。要使用loc选择行,需要提供行标签作为参数。下面是一个简单的示例:

  1. import pandas as pd
  2. data = {'Name': ['Alice', 'Bob', 'Charlie', 'David'],
  3. 'Age': [25, 30, 35, 40],
  4. 'Salary': [50000, 60000, 70000, 80000]}(pd.DataFrame(data)
  5. # 使用loc选择第1行和第3行
  6. selected_rows = df.loc[[0, 2]]

在这个例子中,我们创建了一个包含姓名、年龄和薪水的简单DataFrame。然后,使用loc方法选择了第1行和第3行。注意,在loc中,行标签是按0开始索引的。因此,第1行的索引为0,第3行的索引为2。
2. 使用iloc读取行数据
iloc方法通过整数位置来选择行。要使用iloc选择行,需要提供行位置作为参数。下面是一个简单的示例:

  1. # 使用iloc选择第1行和第3行
  2. selected_rows = df.iloc[[0, 2]]

在这个例子中,我们使用iloc方法选择了第1行和第3行。需要注意的是,在iloc中,行位置是按0开始索引的。因此,第1行的索引为0,第3行的索引为2。
3. 使用loc和iloc读取列数据
与选择行数据类似,我们也可以使用loc和iloc方法来选择列数据。要使用loc选择列,需要提供列标签作为参数。下面是一个简单的示例:

  1. # 使用loc选择'Name'列和'Salary'列
  2. selected_columns = df.loc[:, ['Name', 'Salary']]

在这个例子中,我们使用loc方法选择了’Name’列和’Salary’列。注意,在loc中,列标签是通过一个列表来提供的。要选择多个列,可以将它们的标签放在一个列表中。
同样地,我们也可以使用iloc方法来选择列数据。要使用iloc选择列,需要提供列位置作为参数。下面是一个简单的示例:

  1. # 使用iloc选择第1列和第3列(即'Name'列和'Salary'列)
  2. selected_columns = df.iloc[:, [0, 2]]

在这个例子中,我们使用iloc方法选择了第1列和第3列(即’Name’列和’Salary’列)。需要注意的是,在iloc中,列位置是按0开始索引的。因此,第1列的位置为0,第3列的位置为2。