在python中,我正在阅读一个包含大量内容的html页面内容。 为此,我通过以下方式将网页读作字符串:
url = 'https://myurl.com/'
reqq = req.Request(url, headers={'User-Agent': 'Mozilla/5.0'})
reddit_file = req.urlopen(reqq)
reddit_data = reddit_file.read().decode('utf-8')
如果我打印reddit_data
,我可以正确地看到整个html内容。
现在,在它里面有一个类似json的结构,我想从中读取并提取一些字段。你知道吗
结构下方:
"dealDetails" : {
"f240141a" : {
"egressUrl" : "https://ccc.com",
"title" : "ZZZ",
"type" : "ghi",
},
"5f9ab246" : {
"egressUrl" : "https://www.bbb.com/",
"title" : "YYY",
"type" : "def",
},
"2bf6723b" : {
"egressUrl" : "https://www.aaa.com//",
"title" : "XXX",
"type" : "abc",
},
}
我想做的是:找到dealDetails
字段,然后为每个f240141a
5f9ab246
2bf6723b
获取egressURL、title和type值。你知道吗
谢谢
试试这个
要访问JSON的值,可以将其视为字典,并使用相同的语法来访问值。你知道吗
编辑-1:
确保您的reddit\u数据类型是字典。你知道吗
如果
type(reddit_data)
是str
。你知道吗你需要做。。你知道吗
或者
这将把整个文件转换成一个字典,我建议你只在文本中看起来像字典的部分使用它!(eval不受欢迎的一个原因是它不会将'true'/'false'这样的字符串转换为Python的true/false,请注意:)
希望有帮助!你知道吗
相关问题 更多 >
编程相关推荐