从Pandas单元格中提取列表并使用列表元素作为新列

def results_polls_diff(editinfo, polls): rows = [] for i, election in enumerate(editinfo): polls_key = election['slug'] this_election = polls[polls_key] npolls = this_election.shape[0] diff = (this_election[candidates['R'].ix[i]] - this_election[candidates['D or I'].ix[i]])/100 for c in election['estimates']: if c['party'] == 'Rep' : r1 = c['value'] for c in election['estimates']: if c['party'] == 'Dem' or c['party'] == 'ind' : r2 = c['value'] result = (r1-r2)/100 #init_rows = [] #for d in diff: # init_rows.append((polls_key, result, d)) #return init_rows rows.append((polls_key, result, [d for d in diff])) return rows result_df = pd.DataFrame(results_polls_diff(editinfo, polls), columns = ['race', 'result', 'diff_list']) result_df.head()

race result diff_list 0 2014-delaware-senate-wade-vs-coons -0.22 -0.18 1 2014-delaware-senate-wade-vs-coons -0.22 -0.16 2 2014-delaware-senate-wade-vs-coons -0.22 -0.25 3 2014-delaware-senate-wade-vs-coons -0.22 -0.15

1条回答

网友

1楼 · 发布于 2024-07-07 07:07:59

这是一个策略。考虑一下df

df = pd.DataFrame(dict(A=list('ab'), B=[1, 2], C=[[1, 2, 3], [4, 5, 6]], ))
df

选项1
使用set_index，apply，unstack

^{pr2}$

选项2
构建新的索引和数据帧，然后unstack

names = ['A', 'B']
idx = pd.MultiIndex.from_tuples(df[names].values.tolist(), names=names)
pd.DataFrame(df.C.tolist(), idx).stack().reset_index(names, name='C')

相关问题更多 >

编程相关推荐

热门问题

热门文章