Dataframe:单元级别：将逗号分隔的字符串转换为列表

2条回答

网友

1楼 · 编辑于 2024-07-07 03:02:19

使用^{}将字符串拆分为list

# use str split on the column
df.mgrs_grids = df.mgrs_grids.str.split(',')

# display(df)
   driver_code journey_code                                                                                                                                       mgrs_grids
0      7211863  7211863-140                            [18TWL927129, 18TWL888113, 18TWL888113, 18TWL887113, 18TWL888113, 18TWL887113, 18TWL887113, 18TWL887113, 18TWL903128]
1      7211863  7211863-105  [18TWL927129, 18TWL939112, 18TWL939112, 18TWL939113, 18TWL939113, 18TWL939113, 18TWL939113, 18TWL939113, 18TWL939113, 18TWL960111, 18TWL960112]
2      7211863   7211863-50                            [18TWL927129, 18TWL889085, 18TWL889085, 18TWL888085, 18TWL888085, 18TWL888085, 18TWL888085, 18TWL888085, 18TWL890085]
3      7211863  7211863-109               [18TWL927129, 18TWL952106, 18TWL952106, 18TWL952106, 18TWL952106, 18TWL952106, 18TWL952106, 18TWL952106, 18TWL952105, 18TWL951103]

print(type(df.loc[0, 'mgrs_grids']))
[out]:
list

每值单独一行

在创建列表列之后
使用^{}为列表中的每个值创建单独的行

# get a separate row for each value
df = df.explode('mgrs_grids').reset_index(drop=True)

# display(df.hea())
   driver_code journey_code   mgrs_grids
0      7211863  7211863-140  18TWL927129
1      7211863  7211863-140  18TWL888113
2      7211863  7211863-140  18TWL888113
3      7211863  7211863-140  18TWL887113
4      7211863  7211863-140  18TWL888113

更新

这里是另一个选项，它将'journey_code'组合到'mgrs_grids'的前面，然后将字符串拆分为一个列表。
- 此列表被分配回'mgrs_grids'，但也可以分配给新列

# add the journey code to mgrs_grids and then split
df.mgrs_grids = (df.journey_code + ',' + df.mgrs_grids).str.split(',')

# display(df.head())
   driver_code journey_code                                                                                                                                                    mgrs_grids
0      7211863  7211863-140                            [7211863-140, 18TWL927129, 18TWL888113, 18TWL888113, 18TWL887113, 18TWL888113, 18TWL887113, 18TWL887113, 18TWL887113, 18TWL903128]
1      7211863  7211863-105  [7211863-105, 18TWL927129, 18TWL939112, 18TWL939112, 18TWL939113, 18TWL939113, 18TWL939113, 18TWL939113, 18TWL939113, 18TWL939113, 18TWL960111, 18TWL960112]
2      7211863   7211863-50                             [7211863-50, 18TWL927129, 18TWL889085, 18TWL889085, 18TWL888085, 18TWL888085, 18TWL888085, 18TWL888085, 18TWL888085, 18TWL890085]
3      7211863  7211863-109               [7211863-109, 18TWL927129, 18TWL952106, 18TWL952106, 18TWL952106, 18TWL952106, 18TWL952106, 18TWL952106, 18TWL952106, 18TWL952105, 18TWL951103]

# output to nested list
df.mgrs_grids.tolist()

[out]:
[['7211863-140', '18TWL927129', '18TWL888113', '18TWL888113', '18TWL887113', '18TWL888113', '18TWL887113', '18TWL887113', '18TWL887113', '18TWL903128'],
 ['7211863-105', '18TWL927129', '18TWL939112', '18TWL939112', '18TWL939113', '18TWL939113', '18TWL939113', '18TWL939113', '18TWL939113', '18TWL939113', '18TWL960111', '18TWL960112'],
 ['7211863-50', '18TWL927129', '18TWL889085', '18TWL889085', '18TWL888085', '18TWL888085', '18TWL888085', '18TWL888085', '18TWL888085', '18TWL890085'],
 ['7211863-109', '18TWL927129', '18TWL952106', '18TWL952106', '18TWL952106', '18TWL952106', '18TWL952106', '18TWL952106', '18TWL952106', '18TWL952105', '18TWL951103']]

网友

2楼 · 编辑于 2024-07-07 03:02:19

您还可以将数据帧拆分并分解为表格格式

df1 = df.join(df['mgrs_grids'].str.split(',',expand=True).stack().reset_index(1),how='outer')\
        .drop(['level_1','mgrs_grids'],1).rename(columns={0 : 'mgrs_grids'})


print(df1)

   driver_code journey_code   mgrs_grids
0      7211863  7211863-140  18TWL927129
0      7211863  7211863-140  18TWL888113
0      7211863  7211863-140  18TWL888113
0      7211863  7211863-140  18TWL887113
0      7211863  7211863-140  18TWL888113
0      7211863  7211863-140  18TWL887113
0      7211863  7211863-140  18TWL887113
0      7211863  7211863-140  18TWL887113
0      7211863  7211863-140  18TWL903128
1      7211863  7211863-105  18TWL927129
1      7211863  7211863-105  18TWL939112
1      7211863  7211863-105  18TWL939112
1      7211863  7211863-105  18TWL939113
1      7211863  7211863-105  18TWL939113
1      7211863  7211863-105  18TWL939113
1      7211863  7211863-105  18TWL939113
1      7211863  7211863-105  18TWL939113
1      7211863  7211863-105  18TWL939113
1      7211863  7211863-105  18TWL960111
1      7211863  7211863-105  18TWL960112
2      7211863   7211863-50  18TWL927129
2      7211863   7211863-50  18TWL889085
2      7211863   7211863-50  18TWL889085
2      7211863   7211863-50  18TWL888085
2      7211863   7211863-50  18TWL888085
2      7211863   7211863-50  18TWL888085
2      7211863   7211863-50  18TWL888085
2      7211863   7211863-50  18TWL888085
2      7211863   7211863-50  18TWL890085
3      7211863  7211863-109  18TWL927129
3      7211863  7211863-109  18TWL952106
3      7211863  7211863-109  18TWL952106
3      7211863  7211863-109  18TWL952106
3      7211863  7211863-109  18TWL952106
3      7211863  7211863-109  18TWL952106
3      7211863  7211863-109  18TWL952106
3      7211863  7211863-109  18TWL952106
3      7211863  7211863-109  18TWL952105
3      7211863  7211863-109  18TWL951103

每值单独一行

更新

相关问题更多 >

编程相关推荐

热门问题

热门文章

Dataframe:单元级别：将逗号分隔的字符串转换为列表

每值单独一行

更新

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >