将web垃圾数据转换为json python

2024-07-05 14:52:13 发布

您现在位置:Python中文网/ 问答频道 /正文

我抓取了一个网站,给了我两个字符串:一个字符串是名称(即代码中的文本),另一个是我连接到一个列表的url集合。现在我想把它转换成json

text=[]
text.append(texts+url)
alltexts=json.dumps(text)
return alltexts

我得到了这样一个JSON

^{2}$

我想要这样的东西

{['name':'AAA','id':'2858778011'],['name':'BBB','id':'7589478011'],['name':'CCC','id':'None'],['name':'DDD','id':'None'],['name':'EEE','id':'1001423601']}

Tags: 字符串代码textname文本名称noneid
1条回答
网友
1楼 · 发布于 2024-07-05 14:52:13

假设文本,网址如下表所示。您可以生成如下json

texts=["AAA", "BBB" "CCC","DDD","EEE","FFF"]
urls=["2858778011", "2676882011", "7589478011", "None", "None", "1001423601"]

text=[]
for i,j in zip(texts,urls):
    text.append({"name":i,"id":j})

或者简单地使用列表理解

^{pr2}$

使用您的文本

text=["AAA , 2858778011", "BBB , 2676882011", "CCC , 7589478011", "DDD , None", "EEE , None", "FFF , 1001423601"]

text=[{'name':i.split(',')[0].rstrip(),'id':i.split(',')[1].lstrip()} for i in text]

#output:[{'name': 'AAA', 'id': '2858778011'}, {'name': 'BBB', 'id': '2676882011'}, {'name': 'CCC', 'id': '7589478011'}, {'name': 'DDD', 'id': 'None'}, {'name': 'EEE', 'id': 'None'}, {'name': 'FFF', 'id': '1001423601'}]

相关问题 更多 >