有没有一种方法可以正确地标记（词性标记）组成短语的单词？

1条回答

网友

1楼 · 发布于 2024-09-26 17:52:39

POS标记器通常使用隐马尔可夫模型。如果您的数据没有用这些方法正确标记，那么您的标记器（自制的？）不适合您的输入数据或您的训练数据不充分（太小，错误注释等）。我假设是来自NLTK、spaCy或Stanford（https://nlp.stanford.edu/software/）的工具的标记者。这些软件包将在当前研究的质量方面发挥作用，因此，如果它仍然容易出错，您将无法修复它。如果您手头有一个大型集群，可以使用n-grams和n>；3构建您自己的标记器，如果您愿意的话，但我怀疑这是否比上面提到的模块更好。你知道吗

编程相关推荐

java如何拆分字符串（基于各种分隔符），但不保留空格？
解析。Json格式的txt文件和knime中的java
java Spring rest api为什么在rest api调用的响应中更改了数据类型
升华文本3抛出java。lang.ClassNotFoundException，而记事本++不存在
java Android指纹扫描仪在尝试5次后停止工作？
java Android如何设置精确的重复报警？
java如何使用HTTPGET connect为access API输入用户名和密码
java当测试报告显示没有测试失败时，Gradle为什么说“有失败的测试”？
用Gson实现java获取响应
MapReduce程序中函数错误的java不可映射参数

相关问题更多 >

编程相关推荐

热门问题

热门文章

有没有一种方法可以正确地标记（词性标记）组成短语的单词？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >