robots.txt解析器替代python的robotparser模块

robotexclusionrulesparser的Python项目详细描述


robotexclusionrulesparser是python标准库的替代品 模块RobotParser。它获取并解析robots.txt文件,并可以回答 关于给定用户代理是否允许访问 特定的网址。

该模块具有标准库模块robotparser的一些特性 不,包括解码非ascii robots.txt文件的能力,尊重 对于expires头和对爬网延迟和sitemap指令的理解 以及路径名中的通配符语法。

完整的文档(包括与标准库的比较 模块robotparser)在readme.html中提供。

robotexclusionrulesparser是根据bsd许可证发布的。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java无法从spring resttemplate访问sms网关   使用spark上下文方法参数的java并行化集合不正确   java中ReadLock的并发检查副本   java基于属性比较两个列表是否具有相同的元素   字符串Java文本块:缩进前缀中的制表符和空格的混合   java如何将带有@SpringBootApplication的maven模块作为测试范围中的依赖项添加到另一个maven模块   我需要一些关于在Java中使用2个jar文件的帮助   mysql JPA Java Spring Boot执行查找/连接表   java对话框选择具有特定名称的文件   java如何修复Spring工具套件4中的端口8080错误?   Java中的apache poi Excel阅读器   java如何在tomcat访问日志中记录线程上下文值   java有一种方法可以创建类<T>的实例,该类将类作为传递泛型的构造函数中的参数   默认情况下,java GORM onetomany映射执行即时抓取   java不能在安卓中接受全局变量   统计系统的java MongoDB异步驱动程序排名   java如何解析:无法解析插件“org.springframework.ide.eclipse.ui”?   用Java从一副牌中随机抽取5张牌   javaapachecamel动态消费者   java如何克服使用Flood Fill 4算法时的“薄边界”问题?