Ternip无法格式化字符串

2024-10-05 17:23:38 发布

您现在位置:Python中文网/ 问答频道 /正文

I'm trying to use the library Ternip to add temporay tags to text.。在

为了预处理文档,我必须通过一个注释器运行它,我是currently using the TIMEX3 one.

现在它声明它应该接受一个XML文档,而我并不完全确定如何将其放入。如果我试着用。在

TT = Timex3XmlDocument(sampledoc)

我得到了以下错误:

^{pr2}$

你知道我怎样才能正确地输入文档以便对它们进行正确的注释吗?在


Tags: thetotext文档adduselibrarytags
1条回答
网友
1楼 · 发布于 2024-10-05 17:23:38

根据XmlDocument(基类为Timex3XmlDocument)的the source code,参数应该是xml.dom.minidom.Document的实例,或者是一个表示格式良好的XML文档的字符串,这样它就可以被解析为Document对象(源代码的相关部分包含在这里以便于参考):

class XmlDocument(object):
    def __init__(self, file, nodename=None, has_S=False, has_LEX=False, pos_attr=False):
        if isinstance(file, xml.dom.minidom.Document):
            self._xml_doc = file
        else:
            self._xml_doc = xml.dom.minidom.parseString(file)

{cd5>尤其要确保引用的是 ^{pr2}$

相关问题 更多 >