Facebook页面细节和restfulapi?

2024-10-02 20:35:34 发布

您现在位置:Python中文网/ 问答频道 /正文

嗨,我有一个Facebook页面的网址列表

eg...
http://www.facebook.com/daftpunk
http://www.facebook.com/DavidGuetta
...

最好的方法是:

  • 检查这些url是否是Facebook页面的实际上对于Facebook页面和不是个人资料

  • 从这些页面收集诸如粉丝的详细信息

我们将非常感谢您的帮助。在


Tags: 方法comhttpurl列表facebookwww页面
3条回答

不删除任何内容(这违反了Facebook的服务条款):

  1. 提取URL的用户名部分 i、 e.在 www.facebook.com/在
  2. 执行格式为select fan_count from page where username='michaeljackson'的FQL查询
  3. 如果结果是return,你知道它是 页面而不是用户的配置文件。在

请参阅Page FQL table,以获取可以在同一调用中检索的其他数据。在

fans的#在带有类“FanManager”的a标记中。您可以使用Beautiful Soup获取这个a标记的内容,使用正则表达式从字符串(例如:1000000个fans)中获取数据,或者使用任何您想要的格式。在

要查看该页是否存在,请检查一些标记以查看您是否在404页上。在

使用urllib2pyfacebook获取内容

使用BeautifulSouplxml来解析它

使用re模块(正则表达式)提取用于验证和数据收集的内容

相关问题 更多 >