我想从一堆PDB文件中提取特定链的单字母氨基酸序列
我可以使用SeqIO.parse()来实现这一点,但在我看来,这感觉很不和谐:
PDB_file_path = '/full/path/to/some/pdb'
# Is there a 1-liner for this ?
query_seqres = SeqIO.parse(PDB_file_path, 'pdb-seqres')
for chain in query_seqres:
if chain.id == query_chain_id:
query_chain = chain.seq
#
有没有更简洁、更清晰的方法
在@BioGeek answer上展开,下面是使用PDBParser.get_structure()而不是SeqIO.parse()时提取序列的等效代码
在我看来,它并没有太多的python功能,但您可以使用字典压缩将生成器转换为explict
dict
:相关问题 更多 >
编程相关推荐