我正在准备一个whatsapp文件进行分析。我需要把它分成三列:时间、姓名和信息。文本包含对话中有换行符的一些消息。当我将其加载到数据帧中时,这些消息显示为它们自己的行,而不是一条消息的一部分。在
4/16/19, 15:22 - +254 123 123: Hi my T. L
4/16/19, 15:22 - +254 123 124: Was up
4/17/19, 06:28 - member: Hi team details are Thursday 18 April,
Venue: Hilton Hotel
Time: 07:30am
Come on time team!
4/17/19, 12:17 - member: Hi guys
4/17/19, 12:18 - member: How many are coming tomorrow?
我尝试了两种方法:
在blog{a3}和直接使用{a3}解析{a3}
通过创建一个文件来间接地将这些多行消息编译成一行,即找到here
两种方法都失败了:( 我最喜欢的是第二种方法,只是因为你可以创建一个可以被其他平台使用的文件,比如excel,tableau。。。在
对于方法2:
^{pr2}$我希望我最终不再得到:
4/17/19, 06:28 - member: Hi team details are Thursday 18 April,
Venue: Hilton Hotel
Time: 07:30am
Come on time team!
然后得到:
4/17/19, 06:28 - member: Hi team details are Thursday 18 April, Venue: Hilton Hotel Time: 07:30am Come on time team!
另外,将其输出为数据帧,并正确地完成日期时间、成员和消息。在
正则表达式
您需要以下正则表达式:
在线测试regexin sandbox。在
代码
接收到的数据形成一个日期帧的对象。 例如,最后,将DateFrame对象保存在CSV文件中。在
^{pr2}$在线测试已满in sandbox。在
相关问题 更多 >
编程相关推荐