我有一个html
页面
我用requests
阅读并用beautifulsoup
解析脚本标记,现在这个标记有大量的文本,其中一些是json对象
如何读取此文本中的所有json对象
我想实现的是从amazon daily deals获得价格合理的产品,这就是我现在写的:
from bs4 import BeautifulSoup
import json
import requests
def FindRightScriptTag(soup):
for tag in soup.find_all('script', type="text/javascript"):
if 'sortedDealIDs' and 'dealDetails' in tag.text:
return tag
url = "https://www.amazon.co.uk/gp/deals/"
r = requests.get(url)
data = r.text
soup = BeautifulSoup(data,"html.parser")
tag = FindRightScriptTag(soup)
print (tag)
如果你能分享一些代码就好了。一般来说,如果您知道如何在漂亮的soupxml树中导航,那么可以将已知为json的字符串传递到json module
loads()是您需要的,因为它需要一个json字符串将其转换为Python对象dict供您使用
相关问题 更多 >
编程相关推荐