解析Grobid。tei.xml文件靓汤输出我试着用靓汤从a中提取元素。tei.xml文件使用Grobid生成的文件。在 我可以使用以下方式获取标题: titles = soup.findAll('title') 访问“低级”元素的正确语法是 ...2024-05-03 已阅读: n次
Python属性解析为xml:id我正在尝试使用以下代码从tei文件中提取一些信息: tree = ET.parse(path) root = tree.getroot() body = root.find("{http://www. ...2024-05-03 已阅读: n次
在Python中使用LXML解析<p>标记我正在使用python3.5中的LXML解析TEI-XML文件。出于某种原因,我不明白,解析器会在有嵌套标记的地方中断<p>标记内容。你知道吗 这是我的密码: from lxml impo ...2024-05-03 已阅读: n次
将XML列表与请求一起发布到Elasticsearch?有没有办法使用requests模块将XML列表发布到Elasticsearch? 列表如下所示: [{'author': 'author name 1', 'content': 'content' ...2024-05-03 已阅读: n次
XPath collection()函数是否与lxml和XSLT一起工作?最近,我尝试使用lxml包和包含XPath collection()函数变量的XSL样式表转换XML文件,但在运行代码时出现以下错误: lxml.etree.XSLTApplyError: Faile ...2024-05-03 已阅读: n次
在由<ref>标记分隔的<p>标记之间搜索关键字我想在下面的xml文件中搜索关键字 <?xml version="1.0" encoding="UTF-8"?> <TEI xml:space="preserve" xmlns="h ...2024-05-03 已阅读: n次
在循环中使用TEI XML解析器我发现this篇关于解析TEI XML的文章在处理单个XML文件时非常有用。但是,我有一个完整的目录。我的dir循环没有执行,我不知道为什么 from bs4 import BeautifulSoup ...2024-05-03 已阅读: n次
Python逐位操作,对现有variab进行更改我在根据掩码分配的13位中设置一个值(PID)。。我试图在第4位设置一个标志,同时在13位掩码中保留原始值。。你知道吗 想法??你知道吗 header = 0x0 pid_mask = 0 ...2024-05-03 已阅读: n次
赛顿记忆观塞格费我在尝试使用Cython的memoryview时遇到了分段错误。这是我的代码: def fock_build_init_with_inputs(tei_ints): # set the n ...2024-05-03 已阅读: n次
在遍历数组时未获得预期输出的问题我有以下代码。我当前接收的输出不是预期的输出。我试图解决的伪代码如下所述 for each i in 1 · · · N do TEi = fmob(Li) ...2024-05-03 已阅读: n次
将.tei文件转换为.txt fi我有一个.tei文件,格式如下。在 <biblStruct xml:id="b0"> <analytic> <title level="a" ty ...2024-05-03 已阅读: n次
解析整个目录Etree Parse lxm我需要在目录中用xml标记解析txt文件(我已经用glob创建了一个语料库),但是etreeparse一次只允许一个文件。如何设置一个循环来同时解析所有文件?目标是使用请求将这些文件添加到Elasti ...2024-05-03 已阅读: n次
delb delb是一个库,它为xml编码的文本提供了一个符合人体工程学的模型 python编程语言的文档(例如TEI-XML)。 它填补了软件开发的人文相关领域向 python生态系统中的优秀(科学)社区。 ...2024-05-03 已阅读: n次
corpus2alpino folia和tei到alpino xml 将FoLiA和TEIxml文件转换为Alpinoxml文件。输入文件中的每个句子都是单独分析的。 用法 命令行 pip install corpus2alp ...2024-05-03 已阅读: n次
tei-reader python 3库,用于读取tei p5(lite)文件的文本内容和元数据 库的重点是从文件中提取主文本内容,并提供有关文本的可用元数据。 tl;dr pip install tei-reader ...2024-05-03 已阅读: n次
tef TEfy的诞生是为了简化doc的转换, 使用python脚本时,docx和odt将文档转换成tei xml。是一个 非常基本的包装OxGarage 在https://oxgarage.tei-c.o ...2024-05-03 已阅读: n次
acdh-spacyteiacdh spacy tei是一个python包,提供实用程序类和函数来处理带有/用于spacy的xml(tei,tcf)编码文档 安装 pip安装acdh spacytei 许可 除非另有说明 ...2024-05-03 已阅读: n次
tei_transformer#关于 tei_u transformer是一个python脚本,用于将tei编码的关键版本转换为pdf文件。已经有很多xslt样式表可以做这样的事情,但是使用python却提供了一个秘密的优势:我们 ...2024-05-03 已阅读: n次
swift_collate 用于整理为swift poems项目编码的tei-xml文档的python api 此包Python名称:swift_collate 目前版本: s ...2024-05-03 已阅读: n次
tei-reader-3.5 TEI阅读器 此包Python名称:tei-reader-3.5 目前版本: tei-reader-3.5 0.1.6 最后维护时间 ...2024-05-03 已阅读: n次
tei-reader-3.5-test33553355 TEI阅读器 此包Python名称:tei-reader-3.5-test33553355 目前版本: tei-reader-3.5-test335 ...2024-05-03 已阅读: n次