用Python的许多其他东西从文本文件解析json对象

2024-09-30 20:27:28 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个html页面

我用requests阅读并用beautifulsoup解析脚本标记,现在这个标记有大量的文本,其中一些是json对象

如何读取此文本中的所有json对象

我想实现的是从amazon daily deals获得价格合理的产品,这就是我现在写的:

from bs4 import BeautifulSoup
import json
import requests

def FindRightScriptTag(soup):
    for tag in soup.find_all('script', type="text/javascript"):
        if 'sortedDealIDs' and 'dealDetails' in tag.text:
            return tag

url = "https://www.amazon.co.uk/gp/deals/"
r  = requests.get(url)
data = r.text
soup = BeautifulSoup(data,"html.parser")
tag = FindRightScriptTag(soup)
print (tag)

Tags: 对象textin标记文本importjsonamazon
1条回答
网友
1楼 · 发布于 2024-09-30 20:27:28

如果你能分享一些代码就好了。一般来说,如果您知道如何在漂亮的soupxml树中导航,那么可以将已知为json的字符串传递到json module

loads()是您需要的,因为它需要一个json字符串将其转换为Python对象dict供您使用

相关问题 更多 >