此软件包旨在对临床笔记进行文本分类。
CNClassifier的Python项目详细描述
#临床笔记的文本分类
----
临床笔记通常包含患者的重要医疗信息,如药物、病史、体检等。本课题旨在利用navie-bayes算法和支持向量机对临床短笔记进行分类。默认分类为**药物**、**医院课程**、**实验室**、**体检**和**病史**。
这是体检样本:
>;体检显示温度为96.9,心率为121,血压为122/86,呼吸频率为22,室内空气的氧饱和度为96%。总的来说,病人看起来是急性和慢性病。头部、眼睛、耳朵、鼻子和喉咙检查显示口咽清晰。巩膜无张力。粘膜是湿润的。心血管检查显示心动过速第一心音和第二心音。无杂音、摩擦或疾驰。肺显示左肺基底部呼吸音减弱,叩击音变暗。腹部膨大而结实。肠音阳性。肢体检查未发现棒状物、紫绀或水肿。
以下是药物治疗段落的示例:
>;阿托品。阿司匹林。弗洛纳斯。奎宁西乐葆。康帕嗪。羟丁酸阿米替林。齐尔泰克。百忧解。特拉佐酮。Humulin 70个单位投标。沙丁胺醇。lasix 40 po出价。曲安奈德乳膏。咪康唑乳膏。硝苯地平ER 60每日。赖诺普利,30天。每天10兆卡的KCL。普罗托尼克斯,40天一次。立普妥,20天一次。美沙酮10标。
它很容易使用。
``python
>;>import cnclassifier
>;>note=“这是一个简短的说明,描述了患者的病史信息”
>;>clsf=cnclassifier.classifier()
>;>print(clsf.letspredict(note))
history
```
您还可以为分类器选择不同的功能。
>;分类器(datanum、dataset、labels_index、labels_name、algo、feature、tfidf=0)
-datanum:integer,1-10,用于训练分类器模型的数据集的比例。例如--例如:datanum=7,70%的数据集将用于训练集
-feature:string,feature=“bow”,bow;feature=“skip gram”,skip gram;feature=“cbow”,cbow;
-tfidf:0或1,当tfidf=1时,将使用tfidf,而0表示不使用
-数据集:string,数据集的目录
-labels\index:list,每个文档的标签或标记
-标签名称列表,每个标签的对应类别
-算法:字符串,“mult_nb”:多项式nb,“line_svm”:线性支持向量机
labels_name=['your','category'])
数据集文档的格式应该是:
````
label_index1这是类别1的第一个注释,
label_index1这是类别1的第二个注释,
label_index2我是类别2的第一个注释,
label_index3我是类别3的注释,
```
法律或书面同意,根据许可证分发的软件是在“按原样”的基础上分发的,
无任何明示或暗示的保证或条件。
请参阅许可证,了解管辖许可证的特定语言和许可证的限制。
````
----
临床笔记通常包含患者的重要医疗信息,如药物、病史、体检等。本课题旨在利用navie-bayes算法和支持向量机对临床短笔记进行分类。默认分类为**药物**、**医院课程**、**实验室**、**体检**和**病史**。
这是体检样本:
>;体检显示温度为96.9,心率为121,血压为122/86,呼吸频率为22,室内空气的氧饱和度为96%。总的来说,病人看起来是急性和慢性病。头部、眼睛、耳朵、鼻子和喉咙检查显示口咽清晰。巩膜无张力。粘膜是湿润的。心血管检查显示心动过速第一心音和第二心音。无杂音、摩擦或疾驰。肺显示左肺基底部呼吸音减弱,叩击音变暗。腹部膨大而结实。肠音阳性。肢体检查未发现棒状物、紫绀或水肿。
以下是药物治疗段落的示例:
>;阿托品。阿司匹林。弗洛纳斯。奎宁西乐葆。康帕嗪。羟丁酸阿米替林。齐尔泰克。百忧解。特拉佐酮。Humulin 70个单位投标。沙丁胺醇。lasix 40 po出价。曲安奈德乳膏。咪康唑乳膏。硝苯地平ER 60每日。赖诺普利,30天。每天10兆卡的KCL。普罗托尼克斯,40天一次。立普妥,20天一次。美沙酮10标。
它很容易使用。
``python
>;>import cnclassifier
>;>note=“这是一个简短的说明,描述了患者的病史信息”
>;>clsf=cnclassifier.classifier()
>;>print(clsf.letspredict(note))
history
```
您还可以为分类器选择不同的功能。
>;分类器(datanum、dataset、labels_index、labels_name、algo、feature、tfidf=0)
-datanum:integer,1-10,用于训练分类器模型的数据集的比例。例如--例如:datanum=7,70%的数据集将用于训练集
-feature:string,feature=“bow”,bow;feature=“skip gram”,skip gram;feature=“cbow”,cbow;
-tfidf:0或1,当tfidf=1时,将使用tfidf,而0表示不使用
-数据集:string,数据集的目录
-labels\index:list,每个文档的标签或标记
-标签名称列表,每个标签的对应类别
-算法:字符串,“mult_nb”:多项式nb,“line_svm”:线性支持向量机
labels_name=['your','category'])
数据集文档的格式应该是:
````
label_index1这是类别1的第一个注释,
label_index1这是类别1的第二个注释,
label_index2我是类别2的第一个注释,
label_index3我是类别3的注释,
```
法律或书面同意,根据许可证分发的软件是在“按原样”的基础上分发的,
无任何明示或暗示的保证或条件。
请参阅许可证,了解管辖许可证的特定语言和许可证的限制。
````