用Python解码google的结果

`[u'http://www.motorrad-live.de/test.php%3Fid%3D11', u'http://www.autogaleria.pl/ auto_test/test.php%3Fid%3D37', u'http://oculus.ru/test.php%3Fid%3D2', u'http://o culus.ru/test.php%3Fid%3D1', u'http://www.kerrytaylorauctions.com/detail-test.ph p%3Fid%3D3432', u'http://radio.ghanaweb.com/live-radio.test.php?id=3D4', u'http: //www.studygerman.ru/test/test.php%3Fid%3D261', u'http://www.mhealth.ru/tests/te st.php%3Fid%3D300']

2条回答

网友

1楼 · 编辑于 2024-09-28 05:18:50

首先，需要在插值查询字符串之前引用它：

>>> urllib.quote("inurl:\"test.php?id\"")
'inurl%3A%22test.php%3Fid%22'

>>> "http://ajax.googleapis.com/ajax/services/search/web?v=1.0&gl=de&q=%(q)s&rsz=8&start=0" % dict(q=urllib.quote("inurl:\"test.php?id\""))
'http://ajax.googleapis.com/ajax/services/search/web?v=1.0&gl=de&q=inurl%3A%22test.php%3Fid%22&rsz=8&start=0'

其次，我查看了返回的json，发现未编码的url存储在键unescapedUrl下，因此您可以将print_results(results)替换为：

^{pr2}$

如果确实需要从url键读取，请使用：

def print_results(results):
    L=list(urllib.unquote(r['url']) for r in results)
    print L

网友

2楼 · 编辑于 2024-09-28 05:18:50

您正在搜索unquote函数：

urllib.unquote(url)

相关问题更多 >

编程相关推荐

热门问题

热门文章