from urllib.robotparser import RobotFileParser
import urllib.request
rp = RobotFileParser()
with urllib.request.urlopen(urllib.request.Request('http://stackoverflow.com/robots.txt',
headers={'User-Agent': 'Python'})) as response:
rp.parse(response.read().decode("utf-8").splitlines())
print(rp.can_fetch("*", "http://stackoverflow.com/posts/"))
没有获取的选项机器人.txt对于使用
RobotFileParser
的用户代理,但您可以自己获取它并将字符串数组路径传递到parse()
方法:相关问题 更多 >
编程相关推荐