回答此问题可获得 20 贡献值,回答如果被采纳可获得 50 分。
<p>我正在用python+靓汤创建一个爬虫。你知道吗</p>
<p>我必须访问标记才能在数据层中获取一些数据。你知道吗</p>
<p>我用beatifulsoup进行了一次搜索,并设法返回了我需要的标记,但我无法将其转换为json来访问信息。你知道吗</p>
<p>这是我用来获取的代码:</p>
<pre><code> page = get_html('URL')
dataLayer = page.findAll('script')[NUMBER OF SCRIPT]
</code></pre>
<p>这是我的回报:</p>
<pre><code><script type="text/javascript">
dataLayer = [{
'site': {
'isMobile': false
},
'page': {
'pageType': 'ad_detail',
'detail': {
'parent_category_id': '2000',
'category_id': '2020',
'state_id': '2',
'region_id': '31',
'ad_id': '293231982',
'list_id': '250941507',
'city_id': '9208',
'zipcode':'34710620',
},
'adDetail': {
'adID': '293231982',
'listID': '250941507',
'sellerName': 'Marr',
'adDate': '2016-11-30 20:52:11',
},
},
'session': {
'user': {
'userID': '',
'loginType': ''
}
},
'pageType': 'Ad_detail',
'abtestingEnable' : '1',
// Listing information
'listingCategory': '2020',
// Ad information
'adId': '293231982',
'state': '2',
'region': '31',
'category': '2020',
'pictures': '8',
'listId': '250941507',
//Account Information
'loggedUser':'0',
'referrer': '',
//User Information
}];
</script>
</code></pre>
<p>我想以adDate和zipcode的形式获取数据。你知道吗</p>