Python CSV到JSON解析器将引号添加到outpu

import csv, simplejson, decimal, codecs data = open("cities.txt") reader = csv.DictReader(data, delimiter=",", quotechar='"') with codecs.open("cities.json", "w", encoding="utf-8") as out: for r in reader: for k, v in r.items(): # make sure nulls are generated if not v: r[k] = None # parse and generate decimal arrays elif k == "loc": r[k] = [decimal.Decimal(n) for n in v.strip("[]").split(",")] # generate a number elif k == "geonameid": r[k] = int(v) out.write(simplejson.dumps(r, ensure_ascii=False, use_decimal=True)+"\n")

{"loc": [48.91667, 32.48333], "name": "Zamīn Sūkhteh", "geonameid": 3, "feature_class": "P", "admin3_code": null, "admin2_code": null, "cc2": null, "feature_code": "PPL", "country_code": "IR", "admin1_code": "15", "alternatenames": "Zamin Sukhteh,Zamīn Sūkhteh", "asciiname": "Zamin Sukhteh", "admin4_code": null} {"loc": [48.9, 32.5], "name": "Yekāhī", "geonameid": 5, "feature_class": "P", "admin3_code": null, "admin2_code": null, "cc2": null, "feature_code": "PPL", "country_code": "IR", "admin1_code": "15", "alternatenames": "Yekahi,Yekāhī", "asciiname": "Yekahi", "admin4_code": null} {"loc": [48.2, 32.1], "name": "Tarvīḩ ‘Adāī", "geonameid": 7, "feature_class": "P", "admin3_code": null, "admin2_code": null, "cc2": null, "feature_code": "PPL", "country_code": "IR", "admin1_code": "15", "alternatenames": "Tarvih `Adai,Tarvīḩ ‘Adāī", "asciiname": "Tarvih `Adai", "admin4_code": null}

{"loc": [48.91667, 32.48333], "name": "Zamīn Sūkhteh", "geonameid": 3, "feature_class": "P", "admin3_code": null, "admin2_code": null, "cc2": null, "feature_code": "PPL", "country_code": "IR", "admin1_code": "15", "alternatenames": ["Zamin Sukhteh", "Zamīn Sūkhteh"], "asciiname": "Zamin Sukhteh", "admin4_code": null} {"loc": [48.9, 32.5], "name": "Yekāhī", "geonameid": 5, "feature_class": "P", "admin3_code": null, "admin2_code": null, "cc2": null, "feature_code": "PPL", "country_code": "IR", "admin1_code": "15", "alternatenames": ["Yekahi,Yekāhī"], "asciiname": "Yekahi", "admin4_code": null} {"loc": [48.2, 32.1], "name": "Tarvīḩ ‘Adāī", "geonameid": 7, "feature_class": "P", "admin3_code": null, "admin2_code": null, "cc2": null, "feature_code": "PPL", "country_code": "IR", "admin1_code": "15", "alternatenames": ["Tarvih `Adai", "Tarvīḩ ‘Adāī"], "asciiname": "Tarvih `Adai", "admin4_code": null}

3条回答

网友

1楼 · 编辑于 2024-09-28 21:25:52

在现有的“elif”中添加另一个“elif”来处理“alternateName”：

     elif k == "alternatenames":
        r[k] = [name.strip() for name in v.split(",")]

因此，首先在逗号上拆分字符串，然后去掉开头/结尾处的空白。在

网友

2楼 · 编辑于 2024-09-28 21:25:52

尝试包括以下内容：

elif k == "alternatenames":
   r[k] = [v.split(",")]

网友

3楼 · 编辑于 2024-09-28 21:25:52

我不认为你的引言是这里的问题。您必须手动指定要将该字段转换为字符串列表。在

警告：下面是未测试的代码

elif k == "alternatenames":
    r[k] = unicode.split(v, ',')

我假设v是基于字符的unicode，但是如果是ascii，请调整。在

相关问题更多 >

编程相关推荐

热门问题

热门文章