从一个马拉雅拉姆语单词中提取一个带有词干和去掉后缀的列表
morph-gen的Python项目详细描述
马拉雅拉姆语的语素生成模块
语素生成器有助于从给定的输入词中获取一个包含词干和去掉后缀的列表。
要求
Python3
安装
您可以创建用于安装包的虚拟环境。
python -m venv ENV_DIR
source ENV_DIR/bin/activate
安装语素生成器
pip install morph-gen
否则,请使用
pip install --user morph-gen
实施
安装后,可以导入模块以利用morph()函数
import morph_gen
morph_gen.morph(wordi)
上面的代码将输出输入单词wordi的根。请注意,输入词必须用马拉雅拉姆语。
例如,
如果您需要找到单词“________”的词根,可以执行以下步骤
import morph_gen
morph_gen.morph("മകന്റെയുമാണെന്നാണ്")
输出:
['മകന് ', 'ന്റെ', 'ഉം', 'ആണ്', 'എന്ന്', 'ആണ്']
##根据GNU GPL v3.0授权。