我有一个带有字符串格式的struct类型数组的JSON。当我试图在json文件中编写相同的代码时,我遇到了以下错误。我将此输出文件用于模式验证,并由于特殊字符而导致失败
from pyspark.sql import Row
from pyspark.sql import DataFrame
from pyspark.sql.types import *
import pandas as pd
jsondata1 = '{"activity":[{"activity":"test","activityValue":"1"},{"activity":"test","activityValue":"1"}]}'
my_automatic_schema = json_schema.dumps(jsondata1)
my_automatic_schema
atoDF = sqlContext.read.json(sc.parallelize([my_automatic_schema]))
atoDF.write.format("json").save("mnt//Users/name/test3.json")
我期望得到以下输出:
'{"activity": [{"activityValue": "str", "activity": "str"}, "..."]}'
在我的JSON中得到下面的输出
{"activity":["{\"activityValue\":\"str\",\"activity\":\"str\"}","..."]}
请帮助我提供一个解决方案,如何摆脱特殊字符在我的输出文件
尝试使用以下原始字符串:
相关问题 更多 >
编程相关推荐