<p>你确定你说的是屈折形态学吗?屈折变化是指词性不变,而单词的变化只是为了表达某些语法特征(如过去)。屈折词缀总是后缀,如果我们不考虑不规则词,它们的数量是有限的(<code>-ed</code>,<code>-ing</code>,<code>-er</code>,<code>-est</code>,<code>-s</code>,<code>-es</code>)。你知道吗</p>
<p>然而,你似乎在谈论派生形态学,因为可能只有一个屈折后缀,所以我没有意义去计算它们(如果是引理的话是<code>0</code>,如果是屈折形式的话是<code>1</code>)。你知道吗</p>
<p>如果你说的是派生词缀,那么你要找的就是语素切分/标记化,这不是一件容易的事情,因为单词派生过程受很多因素的影响,而且没有很好的定义。在简单的情况下,我们只需在根中附加一个后缀(或前缀),但是在有些情况下,根中的一些字母会被删除(<code>arrive</code>->;<code>arrival</code>)、更改(<code>try</code>->;<code>tried</code>或更不寻常的情况,如<code>assume</code>->;<code>assumption</code>)甚至附加(<code>drama</code>->;<code>dramatist</code>)。此外,还需要一些语义知识库,因为没有这些知识库,不可能在所有情况下都正确地确定语素。例如,单词<code>remember</code>可以标记为<code>re-</code>+<code>member</code>。在没有语义的情况下,这种形态分析看起来非常合理,因为<code>re-</code>是一个非常流行的前缀,意思是重复,而<code>member</code>是一个已有的词。了解语义关系会告诉我们<code>member</code>和<code>remember</code>没有关联(我相信它们可能在词源上有关联,但在现代语言中,这种关系并不那么明显)。你知道吗</p>
<p>签出<a href="https://www.linguarobot.io/" rel="nofollow noreferrer">Lingua Robot</a>和<a href="http://morpho.aalto.fi/projects/morpho/" rel="nofollow noreferrer">Morfessor</a>。第一个是API,它解析英语<a href="https://en.wikipedia.org/wiki/Wiktionary" rel="nofollow noreferrer">Wiktionary</a>,并以JSON格式提供数据。词缀是这个JSON的一部分。Morfessor是一个用于形态学分割的工具,所以它完全可以满足您的需要。你知道吗</p>