我有下面的示例数据框如下所示。它已经被标记化了。在
No category problem_definition_stopwords
175 2521 ['coffee', 'maker', 'brewing', 'properly', '2', '420', '420', '420']
211 1438 ['galley', 'work', 'table', 'stuck']
912 2698 ['cloth', 'stuck']
572 2521 ['stuck', 'coffee']
我想对这个数据帧做词性标注。下面是我代码的开头。它正在出错:
^{pr2}$错误
TypeError: join() argument must be str or bytes, not 'list'
我想要的结果如下,其中“XXX”是一个标记化的单词,后面是词性(即NNP):
[('XXX','NNP'),('XXX','VBD'),('XXX','POS')]
将problem_definition_stopwords转换为字符串并传递到nltk.sent_标记化如果您试图标记并获取带有POS_标记的POS。在
相关问题 更多 >
编程相关推荐