用于python的germanet api
pygermanet的Python项目详细描述
简介
通过连接到包含 词法信息(有关设置MongoDB数据库的信息,请参见 部分设置。在本地计算机上使用默认值 端口,这很简单:
>>> from pygermanet import load_germanet >>> gn = load_germanet()
您可以在germanet中搜索包含特定元素化的语法集。 使用 语法集的单词形式 函数:
>>> gn.synsets('gehen') [Synset(auseinandergehen.v.3), Synset(funktionieren.v.1), Synset(funktionieren.v.2), Synset(gehen.v.1), Synset(gehen.v.4), Synset(gehen.v.5), Synset(gehen.v.6), Synset(gehen.v.7), Synset(gehen.v.9), Synset(gehen.v.10), Synset(gehen.v.11), Synset(gehen.v.12), Synset(gehen.v.13), Synset(gehen.v.14), Synset(handeln.v.1)]
要查找语法集,必须具有单词的规范形式 将出现在字典(头字)中;此模块调用此字 形成 引理。Germanet实例可以执行 使用来自德国世界杯项目的数据的单词:
>>> gn.lemmatise(u'ginge') [u'gehen']
每一个synset都由拼字形式、词性来表示, 它的第一个引理的感测数;这是唯一的 语法集的标识符。如果你知道这个标识符,你也可以 在Germanet中查找语法集:
>>> funktionieren = gn.synset(u'funktionieren.v.2') >>> funktionieren Synset(funktionieren.v.2)
synset 对象具有数据成员和方法:
>>> funktionieren.hyponyms [Synset(vorgehen.v.1), Synset(leerlaufen.v.2)] >>> gn.synset('Husky.n.1').hypernym_paths [[Synset(GNROOT.n.1), Synset(Entität.n.2), Synset(Objekt.n.4), Synset(Ding.n.2), Synset(Teil.n.2), Synset(Teilmenge.n.2), Synset(Gruppe.n.1), Synset(biologische Gruppe.n.1), Synset(Spezies.n.1), Synset(Rasse.n.1), Synset(Tierrasse.n.1), Synset(Hunderasse.n.1), Synset(Husky.n.1)], [Synset(GNROOT.n.1), Synset(Entität.n.2), Synset(kognitives Objekt.n.1), Synset(Kategorie.n.1), Synset(Art.n.1), Synset(Spezies.n.1), Synset(Rasse.n.1), Synset(Tierrasse.n.1), Synset(Hunderasse.n.1), Synset(Husky.n.1)], [Synset(GNROOT.n.1), Synset(Entität.n.2), Synset(Objekt.n.4), Synset(natürliches Objekt.n.1), Synset(Wesenheit.n.1), Synset(Organismus.n.1), Synset(höheres Lebewesen.n.1), Synset(Tier.n.1), Synset(Gewebetier.n.1), Synset(Chordatier.n.1), Synset(Wirbeltier.n.1), Synset(Säugetier.n.1), Synset(Plazentatier.n.1), Synset(Beutegreifer.n.1), Synset(Landraubtier.n.1), Synset(hundeartiges Landraubtier.n.1), Synset(Hund.n.2), Synset(Husky.n.1)], [Synset(GNROOT.n.1), Synset(Entität.n.2), Synset(Objekt.n.4), Synset(natürliches Objekt.n.1), Synset(Wesenheit.n.1), Synset(Organismus.n.1), Synset(höheres Lebewesen.n.1), Synset(Tier.n.1), Synset(Haustier.n.1), Synset(Hund.n.2), Synset(Husky.n.1)]]
每个synset都包含一个或多个引理
>>> funktionieren.lemmas [Lemma(funktionieren.v.2.funktionieren), Lemma(funktionieren.v.2.funzen), Lemma(funktionieren.v.2.gehen), Lemma(funktionieren.v.2.laufen), Lemma(funktionieren.v.2.arbeiten)]
给定的正交形式可以用多个引理来表示。 属于不同synset的对象
>>> gn.lemmas('brennen') [Lemma(brennen.v.1.brennen), Lemma(verbrennen.v.1.brennen), Lemma(brennen.v.3.brennen), Lemma(brennen.v.4.brennen), Lemma(brennen.v.5.brennen), Lemma(destillieren.v.1.brennen), Lemma(brennen.v.7.brennen), Lemma(brennen.v.8.brennen)]