如何使用python中的StanfordNLP提取丹麦语中的名词短语？

2条回答

网友

1楼 · 编辑于 2024-09-29 23:33:31

一些有用的信息：

1.）据我所知，Stanford CoreNLP（Java）不支持丹麦语。我们没有丹麦人的支持，我也不知道有第三方有丹麦人的模型。因此，无论是Java代码还是服务器都没有多大帮助。虽然有可能某个地方有丹麦模特。我试着在谷歌上多做一点研究。在

2.）对于StanfordNLP（Python）代码库，我们确实支持标记化、词性、引理和依赖解析。现在我们还没有任何名词短语识别软件。我们不生成选区解析，所以我们不能在解析树中找到NP，这是一个依赖解析。我可以想象，有一些不错的技术可以基于依赖性分析或基于词性分块来提取名词短语。我们可以添加一些功能来帮助解决这个问题。虽然这样的技术一开始可能并不完美。但是ud2.0的精神是处理所有语言，所以这似乎是一个完美的例子，可以在ud2.0解析上编写通用名词短语提取规则，然后在Python包中支持的所有70多种语言上运行。在

网友

2楼 · 编辑于 2024-09-29 23:33:31

从CoreNLP提取块的方法是使用constituency parser的输出。不过，正如你所知道的那样，你可以直接根据你的文本块列表来解析你的文本块列表。例如，对于像“I bought the book because I read good reviews about it.”这样的输入语句，方法的输出将如下所示：

<class 'list'>: 
[['NP', 'I'], 
['NP', 'the book'], 
['NP', 'I'], 
['NP', 'good reviews'],
['NP', 'it'], 
['SBAR', 'because I read good reviews about it'], 
['VP', 'bought the book because I read good reviews about it'], 
['VP', 'read good reviews about it']]

由于上面列出了一个测试的方法，所以我还没有把它写出来。在

如果你只需要名词短语，你也可以看看Spacy和解决方案here，这是相当快的。我所说的一切主要是关于你的第一个问题，部分是关于你的第二个问题，我不知道这些解决办法是否也适用于丹麦人。在

相关问题更多 >

编程相关推荐

热门问题

热门文章