如果您将google警报创建为rss提要(不是自动发送到您的电子邮件地址),它包含如下链接:https://www.google.com/url?rct=j&sa=t&url=http://www.statesmanjournal.com/story/opinion/readers/2014/10/13/gmo-labels-encourage-people-make-choices/17171289/&ct=ga&cd=CAIyGjkyZjE1NGUzMGIwZjRkNGQ6Y29tOmVuOlVT&usg=AFQjCNHrCLmbml7baTXaqySagcuKHp-KHA。在
这个链接显然是一个重定向(只要尝试一下,你就会在这里结束:http://www.statesmanjournal.com/story/opinion/readers/2014/10/13/gmo-labels-encourage-people-make-choices/17171289/),但是我不能用Python获得这个最终的url(除非删除url的开头,这很难看)。在
到目前为止,我尝试过urllib2、httplib2和requests包:
有人已经面对过这个问题吗? 谢谢!在
Google不会给你一个HTTP重定向;返回一个200ok响应,而不是30x重定向:
响应是一段HTML和JavaScript,您的浏览器会将其解释为加载一个新的URL。您需要解析该响应来提取目标。在
字符串拆分可以实现:
^{pr2}$如果我们假设主体中的
URL
参数只是查询字符串中url
参数的直接反映,那么您也可以从那里提取它,甚至不必要求Google执行重定向:相关问题 更多 >
编程相关推荐