将表中的组拆分为其子组的表

我的表/数据帧如下所示：

我想把它分成以下几部分

2条回答

网友

1楼 · 编辑于 2024-07-02 11:06:37

所以你的问题是把绳子分开。这是你想要的：

new_col = df[1].str[3:-1]
list(new_col.groupby(df[0]))

网友

2楼 · 编辑于 2024-07-02 11:06:37

所以我设法找到了某种解决办法。在这个解决方案中，我设法删除了第二列中的前缀，并使用pandas中的groupby将条目按第一列分组。然后，循环使用它并将每个组分别写入csv文件。我得到了@Quang的回答和这个link的帮助。也许可以用更好的方法来完成，但我的代码是：

import pandas as pd

#read .csv as dataframe
data=pd.read_csv("BlastOut.csv")

#truncates sp| | from second column (['B']).
new_col=data['B'].str[3:-1]

#replaces second column with new_col
data['B']=new_col.to_frame(name=None) 

#groups dataframe by first column (['A'])
grouped=data.groupby('A')             

#loops through grouped items and writes each group to .csv file with title 
#of group ([group_name].csv)
for group_name, group in grouped:
    group.to_csv('Out_{}.csv'.format(group_name))

更新-删除了除感兴趣的列之外的所有列。这是先前代码的延续

^{pr2}$

我的表/数据帧如下所示：

第1组：

第二组：

第3组：

P0A910：

问题9HVD1：

P09169号：

相关问题更多 >

编程相关推荐

热门问题

热门文章

将表中的组拆分为其子组的表

我的表/数据帧如下所示：

第1组：

第二组：

第3组：

P0A910：

问题9HVD1：

P09169号：

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >