java如何在python中设置Stanford解析器的maxLength选项
我正在使用斯坦福解析器的python接口。我想在做解析工作时跳过长句。因此,我使用:
path1 = '/usr/local/Cellar/stanford-parser/3.4/libexec/stanford-parser.jar'
path2 = '/usr/local/Cellar/stanford-parser/3.4/libexec/stanford-parser-3.4-models.jar'
parser = StanfordParser(path_to_jar = path1, path_to_models_jar = path2, java_options = '-maxLength50')
但它说:
Unrecognized option: -maxLength50
Error: Could not create the Java Virtual Machine.
然后我试着:
parser = StanfordParser(path_to_jar = path1, path_to_models_jar = path2, java_options = '-maxLength=50')
它仍然说
Unrecognized option: -maxLength=50
但以下选项效果良好:
parser = StanfordParser(path_to_jar = path1, path_to_models_jar = path2, java_options = '-mx20000m')
但如果我不设置句子的最大长度,即使设置了“-mx20000m”,我的内存也会一直不足。所以我想我真的需要跳过一些长句
有人能告诉我如何在python中设置“-maxLength”选项吗?谢谢
# 1 楼答案
java选项实际上是JVM的选项,而不是斯坦福解析器的选项。不能设置java选项
我看不到在http://www.nltk.org/_modules/nltk/parse/stanford.html中设置maxLen的选项
在python中如何:if(len(句子.split())>;50:继续
这不是简单多了吗