我已经读过好几篇文章,但是,我无法理清如何使用字典列表中的每一个字典在数据框中创建一行。具体来说,我有两个问题是我有限的字典经验无法解决的
字典示例列表(总计>500k):
pep_list=[{'HV404': 'WVLSQVQLQESGPGLVKPSGTLSLTCAVSGGSISSSNWWSWVR',
'gene': 'HV404',
'aa_comp': {'W': 4,
'V': 5,
'L': 5,
'S': 10,
'Q': 3,
'E': 1,
'G': 5,
'P': 2,
'K': 1,
'T': 2,
'C': 1,
'A': 1,
'I': 1,
'N': 1,
'R': 1},
'peptide': ['WVLSQVQLQESGPGLVKPSGTLSLTCAVSGGSISSSNWWSWVR'],
'Length': 43,
'z': 3,
'Mass': 4557,
'm/z': 1519.0},
{'A0A0G2JNQ3': 'ISGNTSR',
'gene': 'A0A0G2JNQ3',
'aa_comp': {'I': 1, 'S': 2, 'G': 1, 'N': 1, 'T': 1, 'R': 1},
'peptide': ['ISGNTSR'],
'Length': 7,
'z': 2,
'Mass': 715,
'm/z': 357.5},etc.]
预期产出:
Dataframe = pd.DataFrame({values from dictionaries}, columns=["id", "gene", 'aa_comp', 'peptide', 'length', 'z', 'mass','m/z')
感谢您的任何见解
不管这些东西是什么
他们把事情搞砸了,而且看起来不需要他们,因为信息是重复的
如果你想取出一把非代表性钥匙,你可以这样做
非常紧凑的代码,但如果需要,可以在循环中展开它。小心盲目地取出第一个元素,除非它是一个有序的dict,否则第一个元素不能保证是相同的
您可以尝试以下方法:
orient将键更改为dataframe中的一列,reset_索引用于重置索引,尽管在您的情况下可能不需要它
之后,您可以筛选出所需的列
相关问题 更多 >
编程相关推荐