我收到一个Excel文件,其中包含约6万行数据,其中包含有关用户与文本消息应用程序交互的信息。一个简单的数据示例如下所示:
我需要根据对前一行中针对每个唯一用户ID提出的问题的回答提取信息。例如,如果有一条传出消息:“多少天前你开始感到不舒服?如果传入的消息是“3”,我想为每个用户ID创建一个变量“Sick\u Start\u Date”,表示他们生病了,并从他们回答问题的日期中减去3。在上面的例子中,是7/11/2017。 我可以用Excel中的一些公式暴力来做到这一点,但我想可能有一种更好的更“QA-able”的方法来分析以这种方式构建的数据。 需要考虑的其他复杂性:
如果用户在毫秒内响应消息,则数据文件 通常无法正确处理订单–它可能会记录两个传出的订单 消息,然后是传入消息,尽管 传入消息出现在两条传出消息之间
用户并不总是响应,会发送多条传出消息
目前没有回答
相关问题 更多 >
编程相关推荐