2024-10-02 20:35:34 发布
网友
嗨,我有一个Facebook页面的网址列表
eg... http://www.facebook.com/daftpunk http://www.facebook.com/DavidGuetta ...
最好的方法是:
检查这些url是否是Facebook页面的实际上对于Facebook页面和不是个人资料
从这些页面收集诸如粉丝的详细信息
我们将非常感谢您的帮助。在
不删除任何内容(这违反了Facebook的服务条款):
select fan_count from page where username='michaeljackson'
请参阅Page FQL table,以获取可以在同一调用中检索的其他数据。在
fans的#在带有类“FanManager”的a标记中。您可以使用Beautiful Soup获取这个a标记的内容,使用正则表达式从字符串(例如:1000000个fans)中获取数据,或者使用任何您想要的格式。在
要查看该页是否存在,请检查一些标记以查看您是否在404页上。在
使用urllib2或pyfacebook获取内容
使用BeautifulSoup或lxml来解析它
使用re模块(正则表达式)提取用于验证和数据收集的内容
不删除任何内容(这违反了Facebook的服务条款):
select fan_count from page where username='michaeljackson'
的FQL查询请参阅Page FQL table,以获取可以在同一调用中检索的其他数据。在
fans的#在带有类“FanManager”的a标记中。您可以使用Beautiful Soup获取这个a标记的内容,使用正则表达式从字符串(例如:1000000个fans)中获取数据,或者使用任何您想要的格式。在
要查看该页是否存在,请检查一些标记以查看您是否在404页上。在
使用urllib2或pyfacebook获取内容
使用BeautifulSoup或lxml来解析它
使用re模块(正则表达式)提取用于验证和数据收集的内容
相关问题 更多 >
编程相关推荐