根据区域分组不同的地址，Python

Sr.no Area Address 1 vasanth nagar cant railway station 2 mahadevapura akme ballet d1001 outer ring road 3 whitefield villa no 106/107 palm medose 4 whitefield fortune hotel,room 4112 opposite sap labs, 5 vasanth nagar station cantonment

area_ref = data['Area'].sort_index() area_ref2=set(area_ref) from collections import defaultdict grouped = defaultdict(list) for row in data: grouped[row['Area']].append(row['Address']) #dint work . error that index should be int , not string. subset = data[['Area','Address']] tuples1 = [tuple(x) for x in subset.values] from collections import defaultdict res = defaultdict(list) for v, k in tuples1: res[k].append(v) di2=[{'type':k, 'items':v} for k,v in res.items()] #this last one gave me a really bad dictionary.

2条回答

网友

1楼 · 编辑于 2024-09-28 22:25:35

import pandas as pd
def collect_to_set(grp):                               # 3
    return set.union(*[set(row.split()) for row in grp['Address']])

data = pd.read_table('data', sep='\s{2,}')             # 1
result = data.groupby(['Area']).apply(collect_to_set)  # 2
print(result)                                          # 4
# Area
# mahadevapura         set([ballet, outer, road, ring, d1001, akme])
# vasanth nagar            set([cant, station, railway, cantonment])
# whitefield       set([hotel,room, sap, fortune, villa, no, oppo...
# dtype: object

print(result.to_dict())                                # 5
# {'vasanth nagar': set(['cant', 'station', 'railway', 'cantonment']),
# 'mahadevapura': set(['ballet', 'outer', 'road', 'ring', 'd1001', 'akme']),
# 'whitefield': set(['hotel,room', 'sap', 'fortune', 'villa', 'no', 'opposite',
# 'palm', 'labs,', '4112', 'medose', '106/107'])}

我使用read_table将数据片段加载到数据帧中。因为已经有了data作为数据帧，所以当然没有我需要这条线。你知道吗
这是主线。它将data按Area分组，然后调用每个组的collect_to_set函数grp。你知道吗
在collect_to_set中，grp是data（带有all）的子数据帧具有相同Area）的行。它返回所有单词的setgrp['Address']的行。你知道吗
result是Series。你知道吗
如果你想要一个dict，就用result.to_dict()。你知道吗

网友

2楼 · 编辑于 2024-09-28 22:25:35

把你的条目。作为如下所示。并运行排序方法。你知道吗

d=(('vasanth nagar','cant railway station'),
('mahadevapura','akme ballet d1001 outer ring road'),
('whitefield','villa no 106/107 palm medose '),
('whitefield','fortune hotel,room 4112 opposite sap labs,'),
('vasanth nagar','station cantonment'))

for i in sorted(d):
    print i[0],"     ",i[1]

相关问题更多 >

编程相关推荐

热门问题

热门文章