我有一个关于熊猫/NLTK的问题。你知道吗
我的数据帧如下所示:
Name Age Text
Anne 23 "foo you"
Joan 20 "woo you"
Marie 28 "boo you"
John 31 "moo you"
Mark 37 "loo you"
我需要使用NLTK python库计算一个新列,如下所示:
Name Age Text Tokens
Anne 23 "foo you" ['foo','you']
Joan 20 "woo you" ['woo','you']
Marie 28 "boo you" ['boo','you']
John 31 "moo you" ['moo','you']
Mark 37 "loo you" ['loo','you']
我使用以下代码:
df['tokens'] = nltk.word_tokenize(df['text'])
但是我得到了一个错误,因为它每行存储一个令牌,而不是对应行上的所有令牌。你知道吗
欢迎任何帮助。你知道吗
事先非常感谢。你知道吗
相关问题 更多 >
编程相关推荐