我从外部接收到一个json数据集,因此无法影响格式。数据值的格式为方括号和双引号。例如,[{“casenumber”:[“12345678”],“problemcode”:[“ABC123”],“TITLE”:[“你在开玩笑吗?”]}]
我能够将其读取/解析为数据框,但当我尝试将数据框写入Excel时,所有数据都用方括号和单引号标记。是否有一种方法可以删除所有标记,这样我就不需要手动清理Excel数据
在从JSON读取数据之后,我尝试了一些后处理数据的变体,但我无法让它正常工作
import json,
def getJSONData(file):
returnFrame = pd.DataFrame()
with open(file, 'r', encoding="utf8") as jsonfile:
json_data=jsonfile.read()
loaded_json = json.loads(json_data)
returnFrame=returnFrame.append(loaded_json)
#strip out tags
for label, content in returnFrame.iteritems():
returnFrame[label]=content.replace("[","")
return returnFrame
.
.
.
caseDataFrame=getJSONData(JSONFolderFileName)
caseDataFrame.to_excel('CaseData'+str(time.time())+'.xlsx')
在excel中,数据如下所示(假设“|”是单元格边框):
案例编号|问题代码|标题
['12345678']['ABC123']['你在开玩笑吗?']
我宁愿它看起来像:
案例编号|问题代码|标题
12345678 | ABC123 |你在开玩笑吗
如果所有内容都采用相同的格式,则应该可以:
输出:
相关问题 更多 >
编程相关推荐