我使用urlopen和beautifulsoup4获取网页的内容。 我正在获取的网页生成一些动态javascript块。 我想提取整个数组的内容。在
数组的格式如下:
<script type="text/javascript">
var jobmap = {};
jobmap[0]= {jk:'929a2508c8bf2c9c',efccid: '28d4bd688c1e4e86',srcid:'4beb17a7fc4b64e2',cmpid:'be1c2a3db344744f',num:'0',srcname:'City of Oshawa',cmp:'City of Oshawa',cmpesc:'City of Oshawa',cmplnk:'/City-of-Oshawa-jobs-in-Ontario',loc:'Oshawa, ON',country:'CA',zip:'',city:'Oshawa',title:'Systems Analyst',locid:'da5ca33120fa5fe5',rd:'8i0xAbEkuWUhy6dasPEQkceDzWLtCZmZLj2Y-bGYlQI'};
jobmap[1]= {jk:'2d06bbaac441e7d2',efccid: 'beb412fe8b0feacc',srcid:'0a0f0bf6b7639c78',cmpid:'0c05d4e9f9f0206d',num:'1',srcname:'FGL Sports Ltd.',cmp:'FGL Sports Ltd.',cmpesc:'FGL Sports Ltd.',cmplnk:'/FGL-Sports-jobs-in-Ontario',loc:'Ontario',country:'CA',zip:'',city:'',title:'Decision Support Analyst',locid:'8b17acc5f001bdbf',rd:'v7_ZQyGHijdq7ng-cswbFDpj7KoE_Ia4YknbAcijYgE'};
</script>
数组包含未知数量的元素。 如何提取整个数组的内容并将其保存到json对象中?在
BeautifulSoup
只能帮助解决问题的一部分-定位包含所需对象的所需script
元素。然后,您需要使用javascript解析器,如^{印刷品:
^{pr2}$请注意,每个} 或其他方式将javascript对象字符串加载到Python字典中:
item
值都是不能用json.loads()
直接加载的,请考虑使用^{相关问题 更多 >
编程相关推荐