语料库语言学分析工具
kitconc的Python项目详细描述
kitconc
kitconc是一个使用python进行语料库语言学和文本分析的软件包。 其中包括用于创建的工具:
- 下士;
- 频率词列表;
- 关键词;
- 协调线;
- 并置;
- n-gram列表;
- 离散图;
- Excel数据文件。
该软件包是建立在科学研究平台和软件包之上的:nltk、pandas、xlsxwrite和sckit learn。 都在水蟒平台上。
要求
Kitconc需要安装Python3.6(或更高版本)以及:
- nltk;
- 熊猫;
- xlsxwrite;
- MatplotLib。
建议用户安装Python平台作为一个简单的选择。
安装
(确保您有Python3.6(或更高版本)和所需的软件包。)
- 从github下载kitconc;
- 提取其内容;
- 打开终端并导航到“kitconc master”文件夹;
- 使用以下命令:
python setup.py安装
语言资源
Kitconc为葡萄牙语和英语语料库提供了一些语言资源。 它还具有添加自己的语言资源的功能。