JSON中的无效字符

2024-09-29 17:19:07 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个带有字符串格式的struct类型数组的JSON。当我试图在json文件中编写相同的代码时,我遇到了以下错误。我将此输出文件用于模式验证,并由于特殊字符而导致失败

from pyspark.sql import Row
from pyspark.sql import DataFrame
from pyspark.sql.types import * 
import pandas as pd

jsondata1 = '{"activity":[{"activity":"test","activityValue":"1"},{"activity":"test","activityValue":"1"}]}'
my_automatic_schema = json_schema.dumps(jsondata1)
my_automatic_schema

atoDF = sqlContext.read.json(sc.parallelize([my_automatic_schema]))
atoDF.write.format("json").save("mnt//Users/name/test3.json")

我期望得到以下输出: '{"activity": [{"activityValue": "str", "activity": "str"}, "..."]}'

在我的JSON中得到下面的输出 {"activity":["{\"activityValue\":\"str\",\"activity\":\"str\"}","..."]}

请帮助我提供一个解决方案,如何摆脱特殊字符在我的输出文件


Tags: 文件fromimportjsonsqlschemamyactivity

热门问题