从excel文件创建数据框后，某些列无法被函数读取

2024-09-28 19:06:38 发布

男 | 程序猿一只，喜欢编程写python代码。

我已正确地从Excel文件创建了数据框。我正在根据一个条件创建一个新的专栏，这是有效的：

df['sped_bin'] = np.where(df['SPED'] == 'Yes', 0, 1) 
print(df['sped_bin'])

0      1
1      1
2      1
3      0
4      1

但是，在同一excel电子表格中，有些列的值无法识别：

 df['gender_bin'] = np.where(df['Gender'] == 'Male', 0, 1) 
print(df['gender_bin'])


0      1
1      1
2      1
3      1
4      1

（我知道还有其他方法可以将“是/否”或“性别”转换为二进制。这与我的问题无关。）

excel文件中的两列有些不同，我无法理解。我尝试过的事情：

工作效率太低的事情：

excel文件很大，是从另一个程序输出的，我没有访问/源代码。如何使“性别”栏与“速度”栏相似？？？问题可能出在Excel文档中。请帮忙

Tags：文件数据 df bin np where gender excel

1条回答

网友

1楼 · 发布于 2024-09-28 19:06:38

您可以尝试以下方法：

np.where(df['Gender'].str.contains('Female'), 1, 0)