在python中,将dataframe中的列附加到列表中

2024-10-05 10:35:30 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个如下的数据帧

^{tb1}$

我将上面的内容读取到一个数据帧,需要将文本列转换为一个列表,以便执行NER提取

tags = []
for i in df['text'].tolis(():
  tdoc = nlp(i)
  for tags in tdoc.ents:
   tags.append((df.id,tags.text,tags.label_))

以上工作正常,我得到了NER标记,我想将其与数据框架中的“id”列一起导出到数据框架

df_tag = pd.DataFrame_from_records(tags, columns = ['id', 'name', 'type'])

这里的问题是我的id列重复如下

^{tb2}$

期望输出

^{tb3}$

Tags: 数据textin文本框架id内容df
1条回答
网友
1楼 · 发布于 2024-10-05 10:35:30

问题在于df.id返回一个序列,从中重复追加索引,而不是值

另外,第4行和第5行应该是tag,而不是tags

试着这样做:

tags = []
for i in df['text'].tolist():
    tdoc = nlp(i)
    for tag in tdoc.ents:
        tags.append((df.id.values,tag.text,tag.label_))

相关问题 更多 >

    热门问题