使用n语言进行句子检测的问题

1条回答

网友

1楼 · 发布于 2024-09-24 00:21:15

正如下面有人评论的那样，您需要它来处理其他分隔符。不幸的是，您的示例有一个错误！无论您是否找到更好的令牌服务器，它都将自动拆分

我添加了另一个有助于使用多个分隔符的方法

s = "Donc ce n'est pas non plus de vous dire « Allez absolument ici ! », non. hi there this is another sentence"

ss = s.split('.)
ss

["Donc ce n'est pas non plus de vous dire « Allez absolument ici ! », non",
 ' hi there this is another sentence']

也可以对多个分隔符使用re.split

ss = re.split('[!.]',s)

["Donc ce n'est pas non plus de vous dire « Allez absolument ici ",
 ' », non',
 ' hi there this is another sentence']