使用Pandas的fillna函数填充DataFrame中的缺失值

作者:rousong2024.01.17 21:32浏览量:25

简介:在Pandas中,fillna函数用于填充DataFrame中的缺失值。其中,使用中位数(median)是一种常见的填充策略。本文将介绍如何使用fillna函数使用中位数来填充DataFrame中的缺失值。

在使用Pandas的fillna函数填充DataFrame中的缺失值时,可以使用中位数(median)作为填充策略。下面是一个示例代码,演示如何使用fillna函数使用中位数来填充DataFrame中的缺失值:

  1. import pandas as pd
  2. import numpy as np
  3. # 创建一个包含缺失值的DataFrame
  4. df = pd.DataFrame({
  5. 'A': [1, 2, np.nan, 4],
  6. 'B': [5, np.nan, np.nan, 8],
  7. 'C': [9, 10, 11, np.nan]
  8. })
  9. # 使用fillna函数使用中位数填充缺失值
  10. df_filled = df.fillna(df.median())
  11. # 打印填充后的DataFrame
  12. print(df_filled)

在上面的代码中,我们首先创建了一个包含缺失值的DataFrame。然后,我们使用fillna函数并传递df.median()作为参数,将缺失值替换为各列的中位数。最后,我们打印填充后的DataFrame。
需要注意的是,在使用fillna函数时,如果DataFrame中的某一列没有缺失值,那么该列的中位数将作为填充值。另外,如果DataFrame中有多个列具有相同的缺失值,则这些列将具有相同的中位数作为填充值。因此,在使用fillna函数时,要确保传递给函数的参数是正确的,以便得到期望的填充结果。
除了使用中位数作为填充策略外,fillna函数还支持其他填充方法,如使用固定值、前向或后向填充等。这些方法可以帮助你根据具体情况选择最适合的填充策略。在实际应用中,你可能需要根据数据的特点和需求选择合适的填充方法。