Pandas保留具有多个分隔符的行

2024-09-28 23:03:17 发布

您现在位置:Python中文网/ 问答频道 /正文

一个文本文件有多列用于表示,仅显示2列和5行原始df有约400000行

col0 col1 
A1   info
A2   info1,info2
A3   info4,info1,info6
A4   info3,info10
A5   info7,info1,info2,info4,info9

我想做的是在一行中,col1有多个元素,保留第一个元素,并删除预期输出的其余元素

col0 col1 
A1   info
A2   info1
A3   info4
A4   info3
A5   info7

对于健全性检查,是否可以输出在单独的文本文件中修改的行? 示例

用\u行归档\u_已修改.txt会有

col0 col1
A2   info1,info2
A3   info4,info1,info6
A4   info3,info10
A5   info7,info1,info2,info4,info9

编辑:这些是平线


Tags: infoa2元素a1a3col1a4a5
1条回答
网友
1楼 · 发布于 2024-09-28 23:03:17

你需要

df.col1 = df.col1.str.split(',').str[0]


    col0    col1
0   A1      info
1   A2      info1
2   A3      info4
3   A4      info3
4   A5      info7

关于你的第二个问题

df[df.col1.str.split(',').str.len() >1]

将返回所有需要编辑的行,以便在修改数据帧之前将结果保存到另一个df中

相关问题 更多 >