有 Java 编程相关的问题?

你可以在下面搜索框中键入要查询的问题!

java如何在python中设置Stanford解析器的maxLength选项

我正在使用斯坦福解析器的python接口。我想在做解析工作时跳过长句。因此,我使用:

path1 = '/usr/local/Cellar/stanford-parser/3.4/libexec/stanford-parser.jar'
path2 = '/usr/local/Cellar/stanford-parser/3.4/libexec/stanford-parser-3.4-models.jar'
parser = StanfordParser(path_to_jar = path1, path_to_models_jar = path2, java_options = '-maxLength50')

但它说:

Unrecognized option: -maxLength50
Error: Could not create the Java Virtual Machine.

然后我试着:

parser = StanfordParser(path_to_jar = path1, path_to_models_jar = path2, java_options = '-maxLength=50')

它仍然说

Unrecognized option: -maxLength=50

但以下选项效果良好:

parser = StanfordParser(path_to_jar = path1, path_to_models_jar = path2, java_options = '-mx20000m')

但如果我不设置句子的最大长度,即使设置了“-mx20000m”,我的内存也会一直不足。所以我想我真的需要跳过一些长句

有人能告诉我如何在python中设置“-maxLength”选项吗?谢谢


共 (1) 个答案

  1. # 1 楼答案

    java选项实际上是JVM的选项,而不是斯坦福解析器的选项。不能设置java选项

    我看不到在http://www.nltk.org/_modules/nltk/parse/stanford.html中设置maxLen的选项

    在python中如何:if(len(句子.split())>;50:继续

    这不是简单多了吗