多标签分类Python中的数据预处理

2024-09-27 21:29:58 发布

您现在位置:Python中文网/ 问答频道 /正文

我的数据集结构:

Text: 'Good service, nice view, location'
Tag: '{SERVICE#GENERAL, positive}, {HOTEL#GENERAL, positive}, {LOCATI
ON#GENERAL, positive}'

这里的重点是我不知道如何构造我的数据帧。如果你有什么建议的话,这些对我很好。非常感谢。你知道吗


Tags: 数据textviewontagservicelocation结构
1条回答
网友
1楼 · 发布于 2024-09-27 21:29:58

将形容词(好的、坏的等)与酒店属性(服务、风景、位置)分开。您可以从创建自定义词典开始,自动检测并利用新词作为类别。您可以使用一些名称实体识别来执行此操作,下面是一些文章:

https://towardsdatascience.com/named-entity-recognition-with-nltk-and-spacy-8c4a7d88e7dahttps://towardsdatascience.com/a-review-of-named-entity-recognition-ner-using-automatic-summarization-of-resumes-5248a75de175

就我个人而言,我用过斯坦福德的,很酷

相关问题 更多 >

    热门问题