Python Pandas:Datafram中整列的NLTK词性标记

2024-06-01 12:27:33 发布

您现在位置:Python中文网/ 问答频道 /正文

我有下面的示例数据框如下所示。它已经被标记化了。在

No  category    problem_definition_stopwords
175 2521       ['coffee', 'maker', 'brewing', 'properly', '2', '420', '420', '420']
211 1438       ['galley', 'work', 'table', 'stuck']
912 2698       ['cloth', 'stuck']
572 2521       ['stuck', 'coffee']

我想对这个数据帧做词性标注。下面是我代码的开头。它正在出错:

^{pr2}$

错误

TypeError: join() argument must be str or bytes, not 'list'

我想要的结果如下,其中“XXX”是一个标记化的单词,后面是词性(即NNP):

[('XXX','NNP'),('XXX','VBD'),('XXX','POS')]


Tags: 数据no标记示例xxxcoffeeproblemcategory