我有一个熊猫数据框架示例:
import pandas as pd
df = {'ID': [73, 68,1,94,42,22, 28,70,47, 46,17, 19, 56, 33 ],
'CloneID': [1, 1, 1, 1, 1, 2, 2, 3, 3, 3, 4, 4, 4, 4 ],
'VGene': ['64D', '64D', '64D', 61, 61, 61, 311, 311, 311, 311, 311, 311, 311, 311]}
df = pd.DataFrame(df)
看起来像这样:
^{pr2}$我想编写一个简单的脚本,将每个克隆ID输出到不同的输出文件。所以在这个例子中有4个不同的文件。 第一个文件名为“CloneID1.txt”,如下所示:
CloneID ID VGene
1 73 64D
1 68 64D
1 1 64D
1 94 61
1 42 61
第二个文件名为“CloneID2.txt”:
CloneID ID VGene
2 22 61
2 28 311
第三个文件名为“CloneID3.txt”:
CloneID ID VGene
3 70 311
3 47 311
3 46 311
最后一个文件是“CloneID4.txt”:
CloneID ID VGene
4 17 311
4 19 311
4 56 311
4 33 311
我在网上找到的密码是:
import pandas as pd
data = pd.read_excel('data.xlsx')
for group_name, data in data.groupby('CloneID'):
with open('results.csv', 'a') as f:
data.to_csv(f)
但它将所有内容输出到一个文件而不是多个文件。在
您可以执行以下操作:
所以在这里我们迭代
^{pr2}$for g in gp.groups:
中的组,并使用它来创建结果文件路径名,并在组上调用to_csv
,这样您就可以使用以下方法了:实际上,下面的方法更简单:
相关问题 更多 >
编程相关推荐