Java中的Stanford POS标记器
我正在尝试:
Sentence<TaggedWord> taggedString = MaxentTagger.tagStringTokenized("here is a string to tag");
这给了我:
Error: \u\nlp\data\pos-tagger\wsj3t0-18-left3words\left3words-wsj-0-18.tagger (The system cannot find the path specified)
我用的是斯坦福大学的POS tagger
我能做些什么来克服这个问题
# 1 楼答案
它说它找不到那条路。你的机器上有吗
请注意,斜杠是反斜杠——您的操作系统是否支持反斜杠作为文件分隔符
还要注意,这是一条绝对路径——这是有意的吗
如果一切正常,文件是否存在
编辑:如果没有,你应该在这里下载(http://github.com/tiendung/ruby-nlp/blob/master/left3words-wsj-0-18.tagger),把它放在系统指定的路径中,看看会发生什么
# 2 楼答案
似乎您首先必须实例化一个传递包含文件的标记器:
这很糟糕,因为后面使用的标记方法是静态的:
我还必须通过
-Xmx256m
才能让它在该设置下运行