我想从一个列表中创建一个包含两列的数据框。 该列表包含:按顺序排列的州和地区名称 州是那些名字前面有“编辑”的州,其他的词是地区名称 例如,这里的州是阿拉巴马州,她的地区名称是奥本,佛罗伦萨。。。直到我们到达第二个州“阿拉斯加”。你知道吗
['Alabama[edit]',
'Auburn',
'Florence',
'Jacksonville',
'Livingston',
'Montevallo',
'Troy',
'Tuscaloosa',
'Tuskegee',
'Alaska[edit]',
'Fairbanks',
'Arizona[edit]',
'Flagstaff',
'Tempe',
'Tucson',
'Arkansas[edit]',
'Arkadelphia',
....
数据框列将是状态和区域名称。你知道吗
这是我的密码:
for i in range(len(list)):
if 'edit' in list[i]:
university['state'][i:]=re.sub('\[.+','',list[i])
else:
university['regionName'][i]=list[i]
对信息进行预处理以生成
(state,region)
名称的列表元组。使用它来构造数据帧相关问题 更多 >
编程相关推荐