刮削雅虎页面的实用程序

yahooscraper的Python项目详细描述


用于抓取雅虎页面的python实用程序

Build statusPyPI version

yahooscraper包被组织成模块和子模块。每个 叶模块(即没有子模块的模块)包含 接受一个参数–页面的html文本由 模块及其命名空间–并返回从页面解析的一些数据

如果找不到数据,则返回None或者,如果 应该返回iterable,可以返回空iterable。

每个叶模块还包括一个url()函数,该函数返回 由模块表示的页的URL。如果模块 表示一组URL,此函数接受参数。

要从需要身份验证的页面获取数据,请首先获取 使用login模块的经过身份验证的会话 authenticated_session()方法函数。

使用pydoc查看更详细的api文档:

$ pydoc yahooscraper
$ pydoc yahooscraper.login
$ pydoc yahooscraper.fantasy.team

示例

输出幻想NBA球队名称:

importyahooscraperasysLEAGUE_ID=237834TEAM_ID=8session=ys.login.authenticated_session()response=session.get(ys.fantasy.team.url('nba',LEAGUE_ID,TEAM_ID))team=ys.fantasy.team.team(response.text)print(team)

安装

$ pip install yahooscraper

开发

测试

$ python tests.py

展开

  • 凹凸版本在setup.py
  • $ python setup.py register
  • $ python setup.py sdist upload

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java传递实现接口的内部类   java为什么managedbean方法在post请求中的过滤器调用之前调用   java Android应用程序在Android M,O上崩溃,登录A/libc时出错:tid 17938中的致命信号11(SIGSEGV),代码2,故障地址0x343a2944   java JPA存储库。findByAll()返回null,但数据库中存在所有内容   用于发送电子邮件的java Ant脚本   Java小程序HTML页面发生了奇怪的事情   在Postman的请求正文中传递多个JSON数据,并使用Jersy(JXRS)进入Java Rest API   无法强制转换java DAO类   10分钟后重新连接java   正则表达式如何在java中选择字符串直到某个字符   java我的输出有一些问题   Objective中的java时间段   java如何在新屏幕上基于按钮单击在webview中打开url   java哪个selenium版本与Firefox ESR 45.2.0兼容   java无法使用Apache Camel 3.1.0将XML转换为JSON