python中的定性研究支持工具!

qrmine的Python项目详细描述


qrmine

/k_rm_n/

qrmine是一套在python中使用自然语言处理(nlp)和机器学习(ml)的定性研究(qr)数据挖掘工具。qrmine正在工作中。Read More..

它的功能

nlp

  • [X]列出了开放式编码的常用类别。
  • [X]创建一个包含类别、属性和维度的编码字典。
  • [X]主题建模。
  • [X]根据主题安排文档。
  • [X]比较两份文件/访谈。
  • [X]按情绪、类别或标题选择文件/访谈,以便进一步分析。
  • [X]情绪分析
  • []网络分析
  • []联合引文查找器

毫升

  • [X]使用数据训练的神经网络模型的精度
  • [X]来自支持向量机分类器的混淆矩阵
  • [x]k给定记录的最近邻
  • [X]K-均值聚类
  • [X]主成分分析(PCA)
  • []关联规则

如何安装

pip install https://github.com/explosion/spacy-models/releases/download/en_core_web_sm-2.1.0/en_core_web_sm-2.1.0.tar.gz#egg=en_core_web_sm

pip install qrmine

如何使用

  • 输入文件是文本文件和包含数字数据的单个csv文件。可以指定输出TXT文件。

  • 可以使用相应的命令行选项从整个语料库(所有文档)创建编码字典、主题和主题分配。

  • 类别(概念)、摘要和情感可以查看整个语料库或使用--titles开关指定的特定标题(文档)。句子级的情感输出可以使用--sentence标志。

  • 您可以根据情感、标题或类别筛选文档,并使用--filters或-f进行进一步分析

  • 许多ml函数,比如神经网络,都有第二个参数(-n)。在NNET-N中,表示年代数、Kmeans中的簇数、PCA中的因子数和KNN中的邻居数。knn还接受--rec或-r参数来指定记录。

  • CSV中的变量可以使用--titles(默认为all)选择。第一个变量将被忽略(索引),最后一个变量将是dv(从属变量)。

命令行选项

pythom -m qrmine --help
CommandAlternateDescription
--inp-iInput file in the text format with <break> Topic </break>
--out-oOutput file name
--csvcsv file name
--num-nN (clusters/epochs etc depending on context)
--rec-rRecord (based on context)
--titles-tDocument(s) title(s) to analyze/compare
--codedictGenerate coding dictionary
--topicsGenerate topic model
--assignAssign documents to topics
--catList categories of entire corpus or individual docs
--summaryGenerate summary for entire corpus or individual docs
--sentimentGenerate sentiment score for entire corpus or individual docs
--nlpGenerate all NLP reports
--sentenceGenerate sentence level scores when applicable
--nnetDisplay accuracy of a neural network model -n epochs(3)
--svmDisplay confusion matrix from an svm classifier
--knnDisplay nearest neighbours -n neighbours (3)
--kmeansDisplay KMeans clusters -n clusters (3)
--cartDisplay Association Rules
--pcaDisplay PCA -n factors (3)

在代码中使用它

fromqrmineimportContentfromqrmineimportNetworkfromqrmineimportQrminefromqrmineimportReadDatafromqrmineimportSentimentfromqrmineimportMLQRMine
  • 提供更多说明和Jupyter笔记本here.

输入文件格式

nlp

单个文本文件中的单个文档或面试记录,由主题分隔。下面的示例

Transcript of the first interview with John.
Any number of lines
<break>First_Interview_John</break>

Text of the second interview with Jane.
More text.
<break>Second_Interview_Jane</break>

....

支持多个文件,每个文件在主题的底部只有一个break标记。 (以后可能会重命名标记)

毫升

具有以下通用结构的单个csv文件。

  • 带标识符的列1。如果与上述文本文档相关,请包含标题。
  • 最后一列有因变量(dv)。(NLP算法,如主题组件可以提供DV)
  • 所有自变量(数值)之间。
index, obesity, bmi, exercise, income, bp, fbs, has_diabetes
1, 0, 29, 1, 12, 120, 89, 1
2, 1, 32, 0, 9, 140, 92, 0
......

作者

引文

如果有助于你的研究,请在你的出版物中引用qrmine。在这里 是bibtex条目的示例:


@misc{eapenbr2019qrmine,
  title={QRMine -Qualitative Research Tools in Python.},
  author={Eapen, Bell Raj and contributors},
  year={2019},
  publisher={GitHub},
  journal = {GitHub repository},
  howpublished={\url{https://github.com/dermatologist/qrmine}}
}

随着这个工具的理论基础的出版正在进行中。qrmine的灵感来自this work和相关的paper

演示

QRMine

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java如何从thymeleaf表单保存地址对象和用户对象的列表?   序列化java。时间使用Jackson将localdate转换为json   java删除LinearLayout和子级之间的空间   具有内存大小限制的Java队列   java尝试在freemarker中创建min(a,b)函数失败   askQuestion()方法中的Java逻辑问题   在Java客户端中接受服务器的自签名ssl证书   java如何正确更新字符串数组?   java如何使多个方法调用充当一个事务性工作单元   swing如何创建可滚动的Java框?   java如何使用SearchView在多个单词之间搜索?   初始化启动层java时出错。lang.module。FindException:模块javafx。找不到图形   java struts对隐藏字段的转义形式验证   用于构建FEM 3D解算器的java JOGL与JAVA3D   java mvn安装忽略hibernate映射文件   在C++和java之间使用JNI通信时,我在哪里保存“这个”?   java无法使用计时器重新绘制窗口   java我遇到一个找不到符号的错误,我无法解决   IntelliJIdea生成实体时java面临的问题   java在动态文本的末尾添加三个点