我正在研究从医学文本中提取信息(对NLP来说非常陌生!)。目前,我有兴趣找到和提取的药物,其中提到了预先确定的药物清单。例如,考虑文本:
"John was prescribed aspirin due to hight temperature"
因此,考虑到药物列表(Python语言):
list_of_meds = ['aspirin', 'ibuprofen', 'paracetamol']
提取的药物是aspirin
。没关系。在
现在考虑另一个例子:
"John was prescribed ibuprofen, because he could not tolerate paracetamol"
现在,如果我使用列表提取药物(例如使用正则表达式),那么提取的药物是ibuprofen
和{
问题如何区分实际处方药和非耐受药?有没有办法给处方药(用过的)和其他提到的药物贴上标签?在
这是一个复杂的问题。为了捕捉否定的细微差别,您需要进入依赖解析和关系提取的世界。您可以通过以下几种途径为您当前的方法和@Jordan的附加组件添加复杂性:
处理关系中的否定并不是一个解决的问题。这方面的技术水平通常与情绪分析有关。关于使用依赖解析来识别和处理否定的介绍在Stanford NLP Sentiment Analysis using RNN page
克服这个问题的一个方法是在药品名称之前预先定义什么词。所以在你的例子中,这意味着要检查“处方药”或“不能忍受”在药物名称之前。在
这就是我想出来的。如果您想尝试第二段文本,只需将变量
text = first
替换为text = second
。在祝你好运!在
约旦。在
-编辑-
使用变量
medicine
作为输出,您可以从那里使用该变量。在相关问题 更多 >
编程相关推荐