Python中文
首页
教程
问答
标签
搜索
登录
注册
Python3和beauthoulsoup从google获取地址时返回“[]”,而不是地址
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>这是我的python3脚本:</p> <pre><code> import bs4, requests def getCompAddress(https://www.google.com/search): res = requests.get(https://www.google.com/search) res.raise_for_status() soup = bs4.BeautifulSoup(res.text, 'html.parser') elems = soup.select('#rhs_block.LrzXr') print(elems) </code></pre> <p>…这个<code>getCompAddress</code>的url只是google的搜索结果。所以对于<a href="https://www.google.com/search?q=crossings%20at%20five%20forks&oq=crossings%20&aqs=chrome.0.69i59j0l2j69i60l2j69i61.2744j0j7&sourceid=chrome&ie=UTF-8" rel="nofollow noreferrer">Crossings at Five Forks</a>,google在右边显示地址和电话信息。我只想抓取这个地址,我已经把它的CSS路径复制到<code>soup.select</code>。在</p> <p>但是当我运行这个脚本时,输出的只是“<code>[]</code>”。。。而不是地址。我错过了什么?谷歌能阻止这种刮擦吗?谢谢你的帮助!在</p>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>你应该检查一下res.文本用于站点的html响应的变量。在</p> <p>您通常应该使用这种方法来调试beauthulsoup scraper,因为许多不同的原因(例如javascript支持或captcha检查),结果可能与预期的不同</p> <p>另外,据我所知,google有一个captcha检查来防止机器人(并让人们使用他们的付费api)</p>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
如何在乒乓球比赛中预测球的轨迹,对于AI球拍预测?
10 回答
如何在乒乓球游戏中阻止球
3 回答
如何在乘法和模中不乘空间?
8 回答
如何在乘法和除以2个不同的数字之间进行交换?
6 回答
如何在也是数据一部分的单个字符上拆分大字符串
9 回答
如何在乾草堆中找到針,有更好的解決方案嗎?
8 回答
如何在事件wxWidgets中传递自定义数据
4 回答
如何在事件中使用lambda i=i?
10 回答
如何在事件中心只接收最近的数据
9 回答
如何在事件发生之前保持云函数运行?
8 回答
如何在事件发生后使页面重定向到同一页面
1 回答
如何在事件回调之间保持python生成器的状态
3 回答
如何在事件处理程序(pythonsocket、sphinx)中保留docstring
10 回答
如何在事件处理程序中更改wxRichTextCtrl的光标位置?
7 回答
如何在事件处理程序中访问外部对象?
7 回答
如何在事件循环中将协程打包为正常函数?
5 回答
如何在事件循环之外运行协同程序?
5 回答
如何在事件循环结束时为并发未来的所有线程调用类方法?
8 回答
如何在事件文件中只保留一份摘要?
8 回答
如何在事件模板中添加事件
5 回答