有 Java 编程相关的问题?

你可以在下面搜索框中键入要查询的问题!

Java中的Stanford POS标记器

我正在尝试:

Sentence<TaggedWord> taggedString = MaxentTagger.tagStringTokenized("here is a string to tag");

这给了我:

Error: \u\nlp\data\pos-tagger\wsj3t0-18-left3words\left3words-wsj-0-18.tagger (The system cannot find the path specified)

我用的是斯坦福大学的POS tagger

我能做些什么来克服这个问题


共 (2) 个答案

  1. # 1 楼答案

    它说它找不到那条路。你的机器上有吗

    请注意,斜杠是反斜杠——您的操作系统是否支持反斜杠作为文件分隔符

    还要注意,这是一条绝对路径——这是有意的吗

    如果一切正常,文件是否存在

    编辑:如果没有,你应该在这里下载(http://github.com/tiendung/ruby-nlp/blob/master/left3words-wsj-0-18.tagger),把它放在系统指定的路径中,看看会发生什么

  2. # 2 楼答案

    似乎您首先必须实例化一个传递包含文件的标记器:

    new MaxentTagger("models/left3words-wsj-0-18.tagger");
    

    这很糟糕,因为后面使用的标记方法是静态的:

    MaxentTagger.tagStringTokenized("here is a string to tag");
    

    我还必须通过-Xmx256m才能让它在该设置下运行