我试图通过鱼种名称创建新的列,并将整数作为值,保留索引以在之后进行数据帧连接
import pandas as pd
df = pd.read_csv("fishCounts.csv",index_col=0)
countsdf = df[["Fish Count"]].copy()
countsdf.head()
Fish Count
0 38 Sand Bass, 16 Sculpin, 10 Blacksmith
1 138 Sculpin, 28 Sand Bass
2 150 Sculpin Released, 102 Sculpin, 40 Sanddab
3 156 Sculpin, 29 Sand Bass, 5 Black Croaker, 3 ...
4 161 Sculpin
countsdf.columns = ["fish"]
countsdf.fish = countsdf.fish.str.split(", ", expand=False)
countsdf.head()
fish
0 [38 Sand Bass, 16 Sculpin, 10 Blacksmith]
1 [138 Sculpin, 28 Sand Bass]
2 [150 Sculpin Released, 102 Sculpin, 40 Sanddab]
3 [156 Sculpin, 29 Sand Bass, 5 Black Croaker, 3...
4 [161 Sculpin]
这就是我不知道该去哪里的地方。遍历数据帧行?列一张字典的清单? 我是否可以以不同的方式导入数据以简化此操作
编辑:这就是我想说的
Sand Bass Sculpin Blacksmith Sculpin Released Sanddab Black Croaker
0 38 16 10
1 28 138
2 102 150 40
3 29 156 5
4 161
类似于@Manakin的东西
将
Fish Count
转换为整数列表爆炸以使用其id分隔每条鱼
创建字典。在这里,我使用列表理解将
Fish Count
中的值拆分为数字后的空格,然后派生键和值结果
如果需要,可以打印
首先,您需要分解所创建的列表,然后可以使用extract和regex两次,一次匹配数字,然后匹配文本
用数据
做
输出
IIUC,我们可以使用
str.split
和str.extract
与stack
收益率-
那么,你想要/需要的格式就取决于你了
即
或
或
你可以把它变成口述
相关问题 更多 >
编程相关推荐