np.where处理数据占用内存过大怎么办?

头像萌音草莓 · 提问于2021.11.17浏览量:583

当在代码中按照条件设置 amount 列的值

当包含 M 时, 数值100000
当包含 X 时, 数值1000

想通过 np.where 来实现,结果出现占了服务器50%以上的内存
为什么呀?

image.png

 
 
 
  1. import numpy as np
  2. # df_split_desc['amount'] = np.where(df_split_desc['amount'].str.contains('M'),
  3. # df_split_desc['amount'] * 1000000, x)
  4. # df_split_desc['amount'] = np.where(df_split_desc['amount'].str.contains('K'),
  5. # df_split_desc['amount'] * 10000, x)
全部回答 · 1
最新最热
  • 用户头像
    南极星老奶奶2021.11.17 18:47

    你的 amount 是字符串,字符串乖以100万等于把它重复100万次,所以内存爆了呀。

热门问题