我正在Python中动态查询RESTAPI(在Databricks中)。然后将动态处理此API调用的结果。对于许多对象,它运行良好,仅对一些对象:
field X: Can not merge type <class 'pyspark.sql.types.StringType'> and <class 'pyspark.sql.types.DoubleType'>
谷歌搜索之后,似乎出现了空值或类似的情况
当我在互联网上搜索时,我主要会找到你真正需要定义方案的解决方案。例如,使用structtypes等,只有这样,我才会失去我的动态作品的力量
是否有其他解决方案可以动态解决此问题
我的代码:
import requests
import json
import pandas as pd
entity = "entityname"
def callAPI(params):
language = "xx"
headers = {header_attributes}
url = "url"+params
response = requests.get(url, headers=headers)
return response
def flattenJSON(entity):
response = callAPI(entity)
result = response.json()
df = pd.json_normalize(result)
dataFrame = spark.createDataFrame(df)
dataFrame.createOrReplaceTempView(entity)
if __name__ == "__main__":
flattenJSON(entity)
目前没有回答
相关问题 更多 >
编程相关推荐