即使这听起来像是一个重复的问题,我也没有找到解决办法。我有一个很大的.csv文件,看起来像:
prot_hit_num,prot_acc,prot_desc,pep_res_before,pep_seq,pep_res_after,ident,country
1,gi|21909,21 kDa seed protein [Theobroma cacao],A,ANSPV,L,F40,EB
1,gi|21909,21 kDa seed protein [Theobroma cacao],A,ANSPVL,D,F40,EB
1,gi|21909,21 kDa seed protein [Theobroma cacao],L,SSISGAGGGGLA,L,F40,EB
1,gi|21909,21 kDa seed protein [Theobroma cacao],D,NYDNSAGKW,W,F40,EB
....
目的是根据最后两列('ident'和'country')将这个.csv文件分成多个更小的.csv文件。在
我使用了前一个post中的答案中的代码,如下所示:
^{pr2}$但是,我需要我的output.csv只包含列'pep_seq',一个期望的输出,如:
pep_seq
ANSPV
ANSPVL
SSISGAGGGGLA
NYDNSAGKW
我能做什么?在
下面将为每个国家输出一个csv文件,其中只包含您需要的字段。在
你总是可以根据你需要的第二个字段添加另一个步骤。在
您的代码几乎是正确的,它只需要正确设置}。这将告诉
fieldsnames
,并设置{DictWriter
只写入您指定的字段:这将为您提供一个包含以下内容的csv输出文件:
^{pr2}$相关问题 更多 >
编程相关推荐