如何将此.txt转换为数据帧?

2024-10-05 10:21:54 发布

您现在位置:Python中文网/ 问答频道 /正文

我试图用Python进行Whatsapp分析,并希望将其转换为包含日期、小时、人员和消息列的数据帧。在

 '[8/23/17, 1:45:10 AM] Guillermina: Guten Morgen',
 '[8/23/17, 1:47:05 AM] Kester Stieldorf: Good morning :) was in Düsseldorf one hour ago ;)',
 '[8/23/17, 1:47:16 AM] Guillermina: Hahahaha',
 '[8/23/17, 1:47:19 AM] Guillermina: What?',
 '[8/23/17, 1:47:36 AM] Kester Stieldorf: Yeah had to pick something up',

课文比这长。我已经尝试过:

^{pr2}$

但它看起来不起作用。我很确定有一个问题重新编译(),因为当我打印reg和regex时,它们返回空数组。我怎么解决这个问题?在


Tags: 数据消息人员amwhatsappgood小时was
1条回答
网友
1楼 · 发布于 2024-10-05 10:21:54

首先,要解析文件:

with open('file.txt') as f:
    pieces = [i.strip() for i in f.read().splitlines()]

然后使用re.findall

^{pr2}$

                  Time              Name  \
0  8/23/17, 1:45:10 AM       Guillermina
1  8/23/17, 1:47:05 AM  Kester Stieldorf
2  8/23/17, 1:47:16 AM       Guillermina
3  8/23/17, 1:47:19 AM       Guillermina
4  8/23/17, 1:47:36 AM  Kester Stieldorf

                                                Text
0                                       Guten Morgen
1  Good morning :) was in Düsseldorf one hour ago ;)
2                                           Hahahaha
3                                              What?
4                      Yeah had to pick something up

相关问题 更多 >

    热门问题