此软件包旨在对临床笔记进行文本分类。

CNClassifier的Python项目详细描述


#临床笔记的文本分类
----
临床笔记通常包含患者的重要医疗信息,如药物、病史、体检等。本课题旨在利用navie-bayes算法和支持向量机对临床短笔记进行分类。默认分类为**药物**、**医院课程**、**实验室**、**体检**和**病史**。


这是体检样本:
>;体检显示温度为96.9,心率为121,血压为122/86,呼吸频率为22,室内空气的氧饱和度为96%。总的来说,病人看起来是急性和慢性病。头部、眼睛、耳朵、鼻子和喉咙检查显示口咽清晰。巩膜无张力。粘膜是湿润的。心血管检查显示心动过速第一心音和第二心音。无杂音、摩擦或疾驰。肺显示左肺基底部呼吸音减弱,叩击音变暗。腹部膨大而结实。肠音阳性。肢体检查未发现棒状物、紫绀或水肿。

以下是药物治疗段落的示例:
>;阿托品。阿司匹林。弗洛纳斯。奎宁西乐葆。康帕嗪。羟丁酸阿米替林。齐尔泰克。百忧解。特拉佐酮。Humulin 70个单位投标。沙丁胺醇。lasix 40 po出价。曲安奈德乳膏。咪康唑乳膏。硝苯地平ER 60每日。赖诺普利,30天。每天10兆卡的KCL。普罗托尼克斯,40天一次。立普妥,20天一次。美沙酮10标。

它很容易使用。
``python
>;>import cnclassifier
>;>note=“这是一个简短的说明,描述了患者的病史信息”
>;>clsf=cnclassifier.classifier()
>;>print(clsf.letspredict(note))
history
```
您还可以为分类器选择不同的功能。
>;分类器(datanum、dataset、labels_index、labels_name、algo、feature、tfidf=0)
-datanum:integer,1-10,用于训练分类器模型的数据集的比例。例如--例如:datanum=7,70%的数据集将用于训练集
-feature:string,feature=“bow”,bow;feature=“skip gram”,skip gram;feature=“cbow”,cbow;
-tfidf:0或1,当tfidf=1时,将使用tfidf,而0表示不使用
-数据集:string,数据集的目录
-labels\index:list,每个文档的标签或标记
-标签名称列表,每个标签的对应类别
-算法:字符串,“mult_nb”:多项式nb,“line_svm”:线性支持向量机

labels_name=['your','category'])



数据集文档的格式应该是:
````
label_index1这是类别1的第一个注释,
label_index1这是类别1的第二个注释,
label_index2我是类别2的第一个注释,
label_index3我是类别3的注释,
```
法律或书面同意,根据许可证分发的软件是在“按原样”的基础上分发的,
无任何明示或暗示的保证或条件。
请参阅许可证,了解管辖许可证的特定语言和许可证的限制。
````





欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
在reducer中迭代自定义可写组件时出现java问题   属性文件中属性的java命名约定   任务链关闭的java Executor服务   java从Eclipse中的字段生成多个构造函数   java通过继承读取Json   java在不知道密钥的情况下解析json   java camel cxf如何在电子邮件中发送soap请求响应   java程序似乎跳过了if语句的一部分,在移回正确位置之前先移到else语句   测试简单的Java加密/解密inputFileName不存在   java从Jenkins REST API获取所有作业的所有构建的构建细节   java基本包装器和静态“类型”类对象   在WebSphere8.5上部署java代码   java对象相等(对象引用“=”)   java MongoDB整型字段到枚举的转换   每次我重新导入gradle时,IntelliJ都会不断重置Java设置   类型使用键或索引从Java中的数据类型检索值   在Java的列表接口中需要listIterator()和iterator()是什么?