我想访问我公开的LinkedIn页面。在我的本地计算机上,以下代码有效:
import requests
url = "http://de.linkedin.com/pub/ankush-shah/73/9/982"
html = requests.get(url).text
print html
它给出了我的配置文件的正确html。
但是当我在Heroku服务器上执行相同的代码时,我(猜)会被重定向到某个地方并得到thishtml。
另外,当我在heroku服务器上尝试urllib2时:
import urllib2
url = "http://de.linkedin.com/pub/ankush-shah/73/9/982"
u = urllib2.urlopen(url)
这会抛出一个urllib2.HTTPError: HTTP Error 999: Request denied
由于我使用的是virtualenv,本地计算机上的所有库与heroku服务器上安装的库完全相似。LinkedIn会阻止来自Heroku等服务器的HTTP请求吗?如有任何帮助/建议,将不胜感激。
如前所述,here,LinkedIn不允许直接访问。他们把Heroku的IP地址列入黑名单,访问数据的唯一方法就是使用他们的API。
相关问题 更多 >
编程相关推荐