我想从xml文件中读取PMID和author的名字,示例文件如下所示
我得到了PMID和名字,但是循环作为PMID的次数,我想要1个PMID和它们各自的名字
<?xml version="1.0" encoding="utf-8"?>
<!DOCTYPE PubmedArticleSet SYSTEM "http://dtd.nlm.nih.gov/ncbi/pubmed/out/pubmed_190101.dtd">
<PubmedArticleSet>
<PubmedArticle>
<MedlineCitation Status="MEDLINE" Owner="NLM">
<PMID Version="1">2844048</PMID>
<AuthorList CompleteYN="Y">
<Author ValidYN="Y">
<LastName>Guarner</LastName>
<ForeName>J</ForeName>
<Initials>J</Initials>
</Author>
<Author ValidYN="Y">
<LastName>Cohen</LastName>
<ForeName>C</ForeName>
<Initials>C</Initials>
</Author>
<Author ValidYN="Y">
<LastName>Mushi</LastName>
<ForeName>E</ForeName>
<Initials>F</Initials>
</Author>
</AuthorList>
</MedlineCitation>
</PubmedArticle>
<PubmedArticle>
<MedlineCitation Status="MEDLINE" Owner="NLM">
<PMID Version="1">123456</PMID>
<AuthorList CompleteYN="Y">
<Author ValidYN="Y">
<LastName>Smith</LastName>
<ForeName>C</ForeName>
<Initials>C</Initials>
</Author>
<Author ValidYN="Y">
<LastName>Jones</LastName>
<ForeName>E</ForeName>
<Initials>F</Initials>
</Author>
</AuthorList>
</MedlineCitation>
</PubmedArticle>
</PubmedArticleSet>
密码,我试过了
FN=[]
for pmid in root.iter('PMID'):
print(pmid.text)
for id in root.findall("./PubmedArticle/MedlineCitation/Article/AuthorList"):
for f in id.findall("./Author/ForeName"):
fn=f.text
x= '{},{}'.format(i, fn)
#print(x)
FN.append(x)
预期产量
PMID AUTHORS
2844048 'Guarner J J', 'Cohen C C'
我不知道你是否想输出一个特定的格式。但是,您可以尝试以下代码。输出是一个字典,其中键是PMID,值是作者列表。你知道吗
输出:
下面的代码将使用Python数据帧以表格形式给出输出。你知道吗
输出:
上述代码与第一个代码有何不同:
相关问题 更多 >
编程相关推荐