我正试图为我的朋友开发一个python脚本,它将获取一个公共相册的链接,并使用“requests”模块计算每张照片的相似和评论数量。这是我的脚本代码
import re
import requests
def get_page(url):
r = requests.get(url)
content = r.text.encode('utf-8', 'ignore')
return content
if __name__ == "__main__":
url = 'https://www.facebook.com/media/set/?set=a.460132914032627.102894.316378325074754&type=1'
content = get_page(url)
content = content.replace("\n", '')
chehara = "(\d+) likes and (\d+) comments"
cpattern = re.compile(chehara)
result = re.findall(cpattern, content)
for jinish in result:
print "likes "+ jinish[0] + " comments " + jinish [1]
但问题是,它只解析前28张照片的喜欢和评论,而不是更多,问题是什么?有人能帮忙吗?在
[编辑:模块“request”只加载网页,即变量内容包含链接相册的facebook网页的完整html源代码]
使用facebook graph api:
关于专辑,请参考以下内容:
https://developers.facebook.com/docs/reference/api/album/
使用limit属性进行测试,因为它相当慢:
http://graph.facebook.com/460132914032627/photos/?limit=10
编辑
我刚刚意识到like_count不是json的一部分,您可能需要使用fql
如果要查看下一页,则需要将after属性添加到请求中,如下所示:
你可以看看这个JavaScript project作为参考。在
相关问题 更多 >
编程相关推荐