如何迭代pandas列以获取POS标记 - 问答 - Python中文网

如何迭代pandas列以获取POS标记

2024-06-25 23:14:18 发布

您现在位置：Python中文网/ 问答频道 /正文

男 | 程序猿一只，喜欢编程写python代码。

我有一个德国的熊猫评论框架。我想得到POS标签，我找到了支持德语的模式库。在

现在，我想迭代Review列，以获取所有POS，但我得到以下错误（使用以下代码）：

如何迭代pandas列以获取POS标记

代码：

r['POSTags'] = parse(r['German_Reviews'].apply(split))

错误消息：

^{pr2}$

我希望有以下输出：

[(Das, DT), (Essen, NN), (war, VB), (lecker,..

有人知道如何用模式库解决这个问题吗？在

我的DF系列是这样的：

Rating | German_Reviews           | Device ...
----------------------------------------------
5.0    | Das Essen war lecker     | Mobile ...
1.0    | Die Pizza war grauenhaft | Desktop ...
4.0    | Das Restaurant war ok    | Mobile ...

Tags：代码 pos 框架错误模式评论标签 mobile

1条回答

网友

1楼 · 发布于 2024-06-25 23:14:18

也许这样的方法对你的案子有用：

import pandas as pd

'''
Rating | German_Reviews           | Device
5.0    | Das Essen war lecker     | Mobile
1.0    | Die Pizza war grauenhaft | Desktop
4.0    | Das Restaurant war ok    | Mobile
'''

df = pd.read_clipboard(sep = '|')

df.columns = df.columns.str.strip()

com = ['DT', 'NN', 'VB', '...']

df.German_Reviews.str.split().apply(lambda x : list(zip(x, com)))

相关问题更多 >

编程相关推荐

热门问题

热门文章