在数据帧中将句子列表连接成一个句子

2024-07-03 08:13:57 发布

您现在位置:Python中文网/ 问答频道 /正文

我尝试将多个句子列表连接成1,但失败: 例如,我有这个数据帧df(2行):

    text
=====================
    ["Lorem ipsum dolor sit amet, consectetur adipisicing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua. Ut enim ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut aliquip ex ea commodo consequat.",
    "Duis aute irure dolor in reprehenderit in voluptate velit esse cillum dolore eu fugiat nulla pariatur.",
    " Excepteur sint occaecat cupidatat non proident, sunt in culpa qui officia deserunt mollit anim id est laborum."]
    ["Sed ut perspiciatis unde omnis iste natus error sit voluptatem accusantium doloremque laudantium, totam rem aperiam, eaque ipsa quae ab illo inventore veritatis et quasi architecto beatae vitae dicta sunt explicabo.",
    "Nemo enim ipsam voluptatem quia voluptas sit aspernatur aut odit aut fugit, sed quia consequuntur magni dolores eos qui ratione voluptatem sequi nesciunt."]

预期的结果是:

text
==================================
["Lorem ipsum dolor sit amet, consectetur adipisicing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua. Ut enim ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut aliquip ex ea commodo consequat. Duis aute irure dolor in reprehenderit in voluptate velit esse cillum dolore eu fugiat nulla pariatur. Excepteur sint occaecat cupidatat non proident, sunt in culpa qui officia deserunt mollit anim id est laborum.]
[Sed ut perspiciatis unde omnis iste natus error sit voluptatem accusantium doloremque laudantium, totam rem aperiam, eaque ipsa quae ab illo inventore veritatis et quasi architecto beatae vitae dicta sunt explicabo. Nemo enim ipsam voluptatem quia voluptas sit aspernatur aut odit aut fugit, sed quia consequuntur magni dolores eos qui ratione voluptatem sequi nesciunt.]

我尝试使用:

df['text'] = df['text'].str.join(' ')

但它将单词分割成字符,而句子没有连接在一起


Tags: textindfsedetutdolorsit
3条回答

代码:

import pandas as pd

df=pd.DataFrame({'text':[['a','boy','is','noob']]})

df['text']=df['text'].str.join(' ')

输入:

df['text']
Out[14]: 
0    [a, boy, is, noob]
Name: text, dtype: object

输出:

df['text']
Out[12]: 
0    a boy is noob

这对我有用

df['text'] = [' '.join(map(str, l)) for l in df['text']]

正如你所说,你必须使用这样的形式:

new_string = "".join(df['text'].tolist()) 

然后,您可以创建一个新的数据帧:

new_df = pd.DataFrame(data=[new_string], columns=['text'])

相关问题 更多 >