我有一个CSV文件,其中包含有关汽车旅行的信息
我想对这些数据进行整理,以便为每一次旅行(每一行)提供一个列表。该列表应包含旅程代码作为列表中的第一项,然后将所有后续MGRS单元作为单独的项目。最后,我希望将所有这些旅程列表分组到一个父列表中
如果我手动执行此操作,它将如下所示:
journeyCodeA = ['journeyCodeA', 'mgrs1', 'mgrs2', 'mgrs3']
journeyCodeB = ['journeyCodeB', 'mgrs2', 'mgrs4', 'mgrs7']
combinedList = [journeyCodeA, journeyCodeB]
到目前为止,我已经完成了创建每行列表和合并所需列的工作
comparison_journey_mgrs = pd.read_csv(r"journey-mgrs.csv", delimiter = ',')
comparison_journey_mgrs['mgrs_grids'] = comparison_journey_mgrs['mgrs_grids'].str.replace(" ","")
comparison_journey_list = []
for index, rows in comparison_route_mgrs.iterrows():
holding_list = [rows.journey_code, rows.mgrs_grids]
comparison_journey_list.append(holding_list)
问题是它将mgrs_grids列视为单个字符串
我的列表如下所示:
[['7211863-140','18TWL927129,18TWL888113,18TWL888113,...,18TWL903128']]
但我希望它看起来像这样:
[['7211863-140','18TWL927129', '18TWL888113', '18TWL888113',..., '18TWL903128']]
我正在努力找到一种方法来迭代数据帧的每一行,引用mgrs_grids列,然后将逗号分隔的字符串转换为一个适当的列表
谢谢你的帮助
{'driver_code': {0: 7211863, 1: 7211863, 2: 7211863, 3: 7211863},
'journey_code': {0: '7211863-140',
1: '7211863-105',
2: '7211863-50',
3: '7211863-109'},
'mgrs_grids': {0: '18TWL927129,18TWL888113,18TWL888113,18TWL887113,18TWL888113,18TWL887113,18TWL887113,18TWL887113,18TWL903128',
1: '18TWL927129,18TWL939112,18TWL939112,18TWL939113,18TWL939113,18TWL939113,18TWL939113,18TWL939113,18TWL939113,18TWL960111,18TWL960112',
2: '18TWL927129,18TWL889085,18TWL889085,18TWL888085,18TWL888085,18TWL888085,18TWL888085,18TWL888085,18TWL890085',
3: '18TWL927129,18TWL952106,18TWL952106,18TWL952106,18TWL952106,18TWL952106,18TWL952106,18TWL952106,18TWL952105,18TWL951103'}}
list
李>每值单独一行
更新
'journey_code'
组合到'mgrs_grids'
的前面,然后将字符串拆分为一个列表。'mgrs_grids'
,但也可以分配给新列李>您还可以将数据帧拆分并分解为表格格式
相关问题 更多 >
编程相关推荐