Apache Beam python无法解析pubmed XML

2024-10-01 04:44:43 发布

男 | 程序猿一只，喜欢编程写python代码。

嗨，我写了一个beam管道来读取一个目录并使用pubmed_解析库解析下载的pubmed xml文件。该库通过标准python程序运行良好，但如果我将其转换为apache beam pipeline，则在解析过程中失败，并出现错误：希望你能帮我解决这个问题

File "/home/micdsouz/venv/medline/data-preprocessing.py", line 19, in process
    pubmed_dict = pp.parse_pubmed_xml(element)
  File "/home/micdsouz/venv/local/lib/python2.7/site-packages/pubmed_parser/pubmed_oa_parser.py", line 112, in parse_pubmed_xml
    dict_article_meta = parse_article_meta(tree)
  File "/home/micdsouz/venv/local/lib/python2.7/site-packages/pubmed_parser/pubmed_oa_parser.py", line 60, in parse_article_meta
    pmid_node = article_meta.find('article-id[@pub-id-type="pmid"]')
AttributeError: 'NoneType' object has no attribute 'find' [while running 'ReadData']

^{pr2}$

Tags： in py parser home venv parse line article

1条回答

网友

1楼 · 发布于 2024-10-01 04:44:43

这看起来是pubmed_parser库有问题。他们的跟踪器中有两个问题似乎与您的问题相符：

Apache Beam python无法解析pubmed XML

相关问题更多 >

编程相关推荐

热门问题

热门文章

Apache Beam python无法解析pubmed XML

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >