将200行的批合并为1行数据帧

2024-09-27 00:14:46 发布

您现在位置:Python中文网/ 问答频道 /正文

有没有办法把一个数据帧的200行合并成一行。这个数据集由数百万篇文章组成,我正在尝试批量训练一个模型(概要文件级别,而不是消息级别)。你知道吗

下面三行是我的熊猫数据帧(data['Body][:2]):

line1 = "I'm a beast"
line2 = "Ofocurse, that's great"
line3 = "Hey John, what's up?"

我想获得以下输出,其中batch变量表示batch dataframe(batch_data['Body][0])的第一行:

batch = "I'm a beast Ofocurse, that's great Hey John, what's up?"

有没有人有什么建议,或者能给我指出一个方向,而不是一个接一个地把它们串联起来

谨致问候

莎拉


Tags: 数据datathatbatchbody级别johnwhat
1条回答
网友
1楼 · 发布于 2024-09-27 00:14:46

使用^{}

df = pd.DataFrame({'lines':["I'm a beast", 
                           "Ofocurse, that's great", 
                           "Hey John, what's up?"]})

只是

>>> df.lines.str.cat(sep=', ')

"I'm a beast, Ofocurse, that's great, Hey John, what's up?"

sep是分隔符。你可以换任何合适的衣服

>>> df.lines.str.cat(sep=' ')
"I'm a beast Ofocurse, that's great Hey John, what's up?"

相关问题 更多 >

    热门问题