有 Java 编程相关的问题?

你可以在下面搜索框中键入要查询的问题!

nlp从java程序调用Stanford POS Tagger maxentTagger

我是斯坦福POS tagger的新手

我需要从java程序中调用标记器,并将输出定向到文本文件。 我从Stanford postagger中提取了源文件,并尝试调用maxentTagger,但我发现的只是错误和警告

有人能从头开始告诉我如何在我的程序中调用maxentTagger,如果需要的话设置类路径,以及其他类似的步骤吗。请帮帮我


共 (1) 个答案

  1. # 1 楼答案

    当你编译或调用你的程序时,你需要将斯坦福的JAR文件添加到你的类路径中,例如:

    java -classpath stanford-postagger.jar [MyProgram]
    

    然后在你的代码中你需要导入相关的包,你需要的大部分东西似乎都在edu.stanford.nlp.tagger.maxent

    实例化一个新的MaxentTaggerwell described in the JavaDoc,但我将在这里重复其中一些内容:

    要创建新的标记器,请执行以下操作:

    MaxentTagger tagger = new MaxentTagger("models/left3words-wsj-0-18.tagger");
    

    要使用此tagger标记String,请执行以下操作:

    String taggedString = tagger.tagString("Here's a tagged string.")
    

    此外,你还可以使用斯坦福大学的NLP工具创建和标记句子。通过使用BufferedReader读取文件来创建一个句子:

    Sentence sentence = Sentence.readOneSentence(in); // in is a BufferedReader
    

    然后用tagger标记句子:

    Sentence taggedSentence = tagger.tagSentence(sentence);