将字典值映射到数据框中的列表

网友

1楼 · 编辑于 2024-09-30 08:25:58

让我们做explode

df.column.explode().map(dd).groupby(level=0).agg(list)

网友

2楼 · 编辑于 2024-09-30 08:25:58

还有一种方法：

df.explode('column').squeeze().map(dd).groupby(level=0).agg(list)

输出：

0    [1, 2, 3, 4]
1       [5, 6, 7]
Name: column, dtype: object

备选案文2：

pd.Series([list(map(dd.get, l)) for l in df['column']])

输出：

0    [1, 2, 3, 4]
1       [5, 6, 7]
dtype: object

时间：

%timeit df.column.apply(lambda x: pd.Series(x).map(dd).tolist())

1.15 ms ± 39.7 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each)

%timeit df.explode('column').squeeze().map(dd).groupby(level=0).agg(list)

2.56 ms ± 78.7 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)

%timeit pd.Series([list(map(dd.get, l)) for l in df['column']])

88.7 µs ± 4.58 µs per loop (mean ± std. dev. of 7 runs, 10000 loops each)

%timeit df.column.explode().map(dd).groupby(level=0).agg(list)

1.21 ms ± 28 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each)

%timeit df.column.apply(lambda x: list(map(dd.get, x)))

152 µs ± 4.12 µs per loop (mean ± std. dev. of 7 runs, 10000 loops each)

网友

3楼 · 编辑于 2024-09-30 08:25:58

试试apply：

df.column.apply(lambda x: pd.Series(x).map(dct).tolist())

或者只是：

df.column.apply(lambda x: list(map(dct.get, x)))