我正在研究调查数据,受访者接受了两次采访:一次是最初,一次是六到八个月后。每个月都会联系新的受访者,形成轮换小组结构。如何使用以下信息将个人与他/她以前的Python面试进行匹配:
CASEID YYYYMM ID IDPREV DATEPR INCOME
1 2 198706 2 382 198612 12500
2 3 198706 3 4 198612 2500
3 4 198706 4 67 198612 27500
4 5 198706 5 134 198612 12500
5 6 198706 6 193 198612 22500
因此,第一行指出,个人先前对调查的回答包含在先前日期为198612(1986年12月)且ID为382的行中。如何使用创建以下形式的面板数据集所需的信息来匹配这些响应:
CASEID YYYYMM ID IDPREV DATEPR INCOME
1 463 198612 382 - - 12000
1856 198706 2 382 198612 12500
2 97 198612 4 - - 3500
1857 198706 3 4 198612 2500
3 164 198612 67 - - 25000
1858 198706 4 67 198612 27500
4 289 198612 134 - - 12500
1859 198706 5 134 198612 12500
5 323 198612 193 - - 22500
1860 198706 6 193 198612 22500
我查看了pandas的“merge”文档,并尝试了几种不同的方法通过索引来匹配日期和id,但似乎无法获得panel数据结构。你知道吗
开始于:
您可以通过合并两个观察结果:
从中可以选择所需的
columns
,或者在合并时:你可以从这里组成一个小组:
相关问题 更多 >
编程相关推荐