如何使用Spacy(Python)提取法语句子中的所有名词短语

2024-09-30 12:20:21 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在尝试使用Spacy从法语句子中提取所有名词短语。在我尝试的所有情况下,我的代码似乎都无法正常工作。比如说,

    nlp = spacy.load("fr_core_news_sm")
    doc = nlp("Il y a plusieurs petits restaurants dans cette ville.")
    for chunk in doc.noun_chunks:
      print(chunk)

返回

[Il y a plusieurs petits restaurants dans cette ville.]作为名词短语,这似乎是不正确的,因为这里的名词短语是petits restaurants dans cette ville

当我尝试其他短语集时,例如J'ai trouvé une jolie petite chambre.,它返回了3个短语,[J' , une jolie, petite chambre],这似乎也不正确

最后,使用Les deux dernières semaines, il était à Paris..返回[Les deux dernières semaines, il],这似乎是正确的

对于如何确保代码在前两个示例中正确运行,我将非常感谢您提供的任何帮助或指导


Tags: 代码docnlpplusilchunk名词restaurants
1条回答
网友
1楼 · 发布于 2024-09-30 12:20:21

首先尝试更新您的SpaCy版本

pip install spacy  upgrade

将模型从较小的fr_core_news_sm更改为较大的模型,例如fr_core_news_lg

要安装:

-python -m spacy download fr_core_news_lg

或者直接从SpaCy的模型库进行pip安装,例如

pip install https://github.com/explosion/spacy-models/releases/download/fr_core_news_lg-2.3.0/fr_core_news_lg-2.3.0.tar.gz

在大多数NLP任务中,较大的模型通常具有更好的准确性

相关问题 更多 >

    热门问题