如何使用python在google搜索中获得正确的url

2024-09-27 00:11:34 发布

您现在位置:Python中文网/ 问答频道 /正文

我试图在谷歌搜索中得到第一个网址。就像我在谷歌上搜索“tcs”,它给出了http://www.tcs.com/。 大部分结果是正确的,但有时我没有得到正确的网址。我想要一个解决办法。 在谷歌上试试这个搜索:-“欧拉·鲍贝特。u、 鲍莱东格斯。百万英镑” 结果来了:-https://www.firmenwissen.com/.../EULER_BAUBETREUUNG_UND_BAULEITUNGSGESELLSCHAFT_MBH.html在

在输出URL的中间。。。。。。就要来了

期望的输出是:-https://www.firmenwissen.com/en/az/firmeneintrag/63654/6110225969/EULER_BAUBETREUUNG_UND_BAULEITUNGSGESELLSCHAFT_MBH.html

在代码:-在

   import requests

   from bs4 import BeautifulSoup as bs

   var="Euler Baubetr. u. Bauleitungsges. mbH"

   goog_search = "https://www.google.co.uk/search?sclient=psyab&client=ubuntu&hs=k5b&channel=fs&biw=1366&bih=648&noj=1&q=" + var


   r = requests.get(goog_search)

   soup = bs(r.text, "html.parser")

   url=soup.find('cite').text

   print(url)

Tags: httpsimportcomsearchhtmlwwwrequests网址
1条回答
网友
1楼 · 发布于 2024-09-27 00:11:34

您应该导航到正确的href以获取url,请参阅下面的代码。。。在

import requests
from bs4 import BeautifulSoup as bs

var="Euler Baubetr. u. Bauleitungsges. mbH"
goog_search = "https://www.google.co.uk/search?sclient=psyab&client=ubuntu&hs=k5b&channel=fs&biw=1366&bih=648&noj=1&q=" + var

r = requests.get(goog_search)
soup = bs(r.text, "html.parser")
url = soup.find('h3',attrs={'class':'r'}).a['href']
print(url)

相关问题 更多 >

    热门问题