Python从websi中获取fb注释

import BeautifulSoup import urllib2 import re url = 'http://techcrunch.com/2012/05/15/facebook-lightbox/' fd = urllib2.urlopen(url) soup = BeautifulSoup.BeautifulSoup(fd) fb_comment = soup("div", {"class":"postText"}).find(text=True) print fb_comment

3条回答

网友

1楼 · 编辑于 2024-09-23 04:20:04

Facebook的评论是使用AJAX动态加载的。您可以从原始页面中抓取以下内容：

<fb:comments href="http://techcrunch.com/2012/05/15/facebook-lightbox/" num_posts="25" width="630"></fb:comments>

之后，你需要向某个Facebook API发送一个请求，该API将给出该标记中URL的注释。在

网友

2楼 · 编辑于 2024-09-23 04:20:04

您要查找的页面部分未包含在源文件中。使用浏览器，您可以通过打开页面源代码亲自查看这些内容。在

在将文档传递给BeautifulGroup之前，您需要使用类似于pywebkitgtk的方法来执行javascript

网友

3楼 · 编辑于 2024-09-23 04:20:04

就像Christopher和Thiefmaster一样：这都是因为javascript。在

但是，如果您真的需要这些信息，您仍然可以检索它，这要归功于http://seleniumhq.org上的Selenium，然后在这个输出上使用beautifulsoup。在

相关问题更多 >

编程相关推荐

热门问题

热门文章