擅长:python、mysql、java
<p>您可以从<a href="https://github.com/Mottl/ru_punkt" rel="nofollow noreferrer">https://github.com/Mottl/ru_punkt</a>获取经过培训的俄语句子标记器,它可以处理俄语名称的首字母和缩写。
在</p>
<pre><code>text = ("организовывал забастовки и демонстрации, ",
"поднимал рабочих на бакинских предприятиях А.И. Манташева.")
print(tokenizer.tokenize(text))
</code></pre>
<p>输出:</p>
^{pr2}$