我不能使用python的“replace”使我的0成为缺少的值（0>np.nan公司)

# Read function def get_df2(file): mydata2 = [] for chunk in pd.read_csv(file,chunksize=500000,header = None,sep='\t'): mydata2.append(chunk) user_data = pd.concat(mydata2,axis=0) names2=['user_id','age','gender','area','status'] user_data.columns = names2 return user_data # read user_data_path = 'a_url' user_data = get_df2(user_data_path) user_data.head()

2条回答

网友

1楼 · 编辑于 2024-10-03 21:34:44

在这种情况下，Python会变得恼人。你知道吗

如前所述，这可能是因为0是字符串而不是整数。可以由

user_data.replace("0",np.nan,inplace = True)

但是，我想指出的是，在您知道什么样的数据应该位于数据帧的列中的场景中，您应该显式地将其设置为该类型，这样，每当出现这样的场景时，就会出现错误，并且您将确切地知道问题所在。你知道吗

在您的例子中，列是：

names2=['user_id','age','gender','area','status']

让我们假设

用户id为字符串
年龄是整数
性别是字符串
区域是字符串
状态为字符串

你可以告诉熊猫哪个列应该是哪个数据类型

user_data = userdata.astype({"user": str, "age": integer, "gender": str, "area": str, "status": str})

还有许多其他方法可以做到这一点，如下面的answer中所述。选择适合你或你需要的。你知道吗

网友

2楼 · 编辑于 2024-10-03 21:34:44

您的0可能只是字符串，请尝试使用：

user_data = user_data.replace('0', np.nan)

相关问题更多 >

编程相关推荐

热门问题

热门文章