用于从hackernews检索评论和故事的python库

hackernews_scraper的Python项目详细描述


哈克内斯刮刀
==================

抓取[黑客新闻](https://news.ycombinator.com)评论和帖子
使用[Algolia API](http://hn.algolia.com/api/)。


用法
=====

``Python
来自hackernews scraper import commentscraper

commentscraper.getcomments(自=1394039447起)
```

以上命令将返回一个生成器,该生成器将一次生成一条评论。
它将继续运行,直到没有更多的评论可供获取,或者直到
它达到了Hacker News设置的50页限制。在后一种情况下,a
将引发“Toomanyitemsexception”。

如果hacker news api响应缺少任何必需字段,则scraper
将引发“keyerror”。


响应格式
===============

评论:
```
{
“作者”:u'dhmholley',
“注释ID”:u'7531026',
“评论文”:你还在吹哨吗?…',
“创建位置”:U'2014-04-04T12:57:38.000Z',
“父ID”:7530853,
“点”:1,
“故事ID”:无,
“故事标题”:无,
“故事URL”:无,
“时间戳”:1396616258,
“标题”:无,
“url”:无
}
```

故事:
```
{
“作者”:u“sethco”,
“创建位置”:U'2014-04-04T12:56:23.000Z',
“objectid”:无,
“点”:1,
“故事文本”:1,
“时间戳”:1396616183,
“标题”:今日美国电力公司IPO,
“url”:u'http://www.businesswire.com/news/home/20140403006541/en.uz4cbq1dvih'
}
```

测试
=======

您需要有[httpretty](https://github.com/gabrielfalcao/httpretty)
和[工厂男孩](https://github.com/rbarrois/factory\u boy)已安装。

在根文件夹或“tests”文件夹中运行“notests”。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java如何使用“Wed,01 Jul 2015 17:32:41 EDT”解析字符串   java Storm apache升级(1.0.0到2.0.0)   java类驻留在不同的目录中,而不是包指定的目录。为什么?   将Java中的图像缩放到非常小的维度   java如何通过子文档从自定义方面访问ElasticSearch parentdoc字段   java如何在RationalSoftwareArchitect中使用findbugs?   Java中的事件提升处理   java值被添加到arrayList的所有索引中,而不是在“”时添加到最后一个索引中。正在使用arraylist的add()方法   JFrame中的java JPanel派生类   java如何用循环和异步方法模拟类   java Android阻止可绘制背景超出视图范围   为客户排序Java阵列   java Apache poi如何将工作表设置为枚举位置值属性?   java Rhino在使用自定义类参数调用javascript函数时出错   java格式化日期从年月日到年月日   spring如何修复java。lang.illegalargumentexception在此特定场景中是否尝试创建具有null实体的合并事件?   java如何创建更好的对象