在python不工作的情况下解析多行whatsapp文本

2024-09-27 07:19:16 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在准备一个whatsapp文件进行分析。我需要把它分成三列:时间、姓名和信息。文本包含对话中有换行符的一些消息。当我将其加载到数据帧中时,这些消息显示为它们自己的行,而不是一条消息的一部分。在

4/16/19, 15:22 - ‪+254 123 123‬: Hi my T. L

4/16/19, 15:22 - ‪+254 123 124‬: Was up

4/17/19, 06:28 - member: Hi team details are Thursday 18 April, 

Venue: Hilton Hotel

Time: 07:30am

Come on time team!

4/17/19, 12:17 - member: Hi guys

4/17/19, 12:18 - member: How many are coming tomorrow?

我尝试了两种方法:

  1. 在blog{a3}和直接使用{a3}解析{a3}

  2. 通过创建一个文件来间接地将这些多行消息编译成一行,即找到here

两种方法都失败了:( 我最喜欢的是第二种方法,只是因为你可以创建一个可以被其他平台使用的文件,比如excel,tableau。。。在

对于方法2:

^{pr2}$

我希望我最终不再得到:

4/17/19, 06:28 - member: Hi team details are Thursday 18 April, 

Venue: Hilton Hotel

Time: 07:30am

Come on time team!

然后得到:

4/17/19, 06:28 - member: Hi team details are Thursday 18 April, Venue: Hilton Hotel Time: 07:30am Come on time team!

另外,将其输出为数据帧,并正确地完成日期时间、成员和消息。在


Tags: 文件方法消息timedetailshihotelare
1条回答
网友
1楼 · 发布于 2024-09-27 07:19:16

正则表达式

您需要以下正则表达式:

^(\d{1,2})\/(\d{1,2})\/(\d\d), (24:00|2[0-3]:[0-5][0-9]|[0-1][0-9]:[0-5][0-9]) - (\S[^:]*?): (.*)$

在线测试regexin sandbox。在

代码

接收到的数据形成一个日期帧的对象。 例如,最后,将DateFrame对象保存在CSV文件中。在

^{pr2}$

在线测试已满in sandbox。在

相关问题 更多 >

    热门问题