在Python中更改与robotparser一起使用的用户代理

1条回答

网友

1楼 · 发布于 2024-09-27 18:22:22

没有获取的选项机器人.txt对于使用RobotFileParser的用户代理，但您可以自己获取它并将字符串数组路径传递到parse()方法：

from urllib.robotparser import RobotFileParser
import urllib.request

rp = RobotFileParser()


with urllib.request.urlopen(urllib.request.Request('http://stackoverflow.com/robots.txt',
                                                   headers={'User-Agent': 'Python'})) as response:
   rp.parse(response.read().decode("utf-8").splitlines())

print(rp.can_fetch("*", "http://stackoverflow.com/posts/"))

编程相关推荐

我可以用C++代码使用java代码吗？
java使用JSR303在派生类中提供更具体的约束
java在这个查找唯一路径数算法中我做错了什么？
java如何为2个不同的服务提供商使用2个不同的SSL证书？
java在Gridview上绘制文本
java使用连接for循环构建字符串名
java StringBuilder拆分无法处理某些文件
java事件关注EditText
Java Web Start“找不到URL的缓存资源”
java程序从命令行运行的速度比在Eclipse中慢

相关问题更多 >

编程相关推荐

热门问题

热门文章

在Python中更改与robotparser一起使用的用户代理

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >