用python实现Brat注释文件的字符偏移

2024-09-30 18:24:15 发布

您现在位置:Python中文网/ 问答频道 /正文

我有两个UTF-8文本文件:

repr(file1.txt):

\nSTATEMENT OF WORK\n\n\nSTATEMENT OF WORK NO. 7\nEffective Date: February 15, 2015

repr(file2.txt):

^{pr2}$

它们各自的Brat注释文件具有以下注释:

文件1.ann:

^{3}$

文件2.ann:

T1  date 53 67   July 25, 2014.

但是,当我使用python从.txt中使用上述偏移量检索字符时,我得到:

file1.read()[61:78]:

February 15, 2015

file2.read()[53:67]:

ly 25, 2014. b

为什么我的补偿在第一种情况下有效,而在第二种情况下不起作用?在


Tags: 文件ofnotxtread情况file1utf