如何解决标点预测问题?
这个问题的工作演示可以在这个link中找到。你知道吗
输入文本如下:
"its been a little while Kirk tells me its actually been
three weeks now that Ive been using this device right here
that is of course the Galaxy S ten I mean Ive just been
living with this phone this has been my phone has the SIM
card in it I took photos I lived live I sent tweets whatsapp
slack email whatever other app this was my smart phone"
预测文本的标点符号(尤其是语音转录)是一个众所周知的问题。你知道吗
您可以尝试使用Punctuator2,既可以使用提供的模型,也可以通过为域中的文本训练新模型。在自述文件的底部,可以找到一些相关项目的指针。你知道吗
Grammarly开发了一种更简单的方法,只在连续句之间插入句点,如下所述:
https://www.grammarly.com/blog/nlp-run-on-sentences/
他们用真实的和人工的训练数据做了一些很好的实验,这很有用,因为很容易从你知道的句子边界有可靠标点的文本中生成训练数据,比如报纸文本。你知道吗
相关问题 更多 >
编程相关推荐