我是新来的网页抓取。在
我找不到我在这段代码中的错误:
import requests
import csv
from bs4 import BeautifulSoup
url = "https://www.transfermarkt.co.uk/spieler-
statistik/wertvollstespieler/marktwertetop"
response=requests.get(url)
html_icerigi=response.content
soup=BeautifulSoup(html_icerigi,"html.parser")
footballer = soup.find_all("a",{"class":"spielprofil_tooltip tooltipstered"})
footballer_list=[]
for footballer in footballer_list:
footballer=footballer.text
footballer=footballer.strip()
footballer=footballer.replace("\n","")
footballer_list.append(["Futbolcu:{}".format(footballer)])
print(footballer_list)
安装Selenium,然后以这种方式访问它。否则,您的代码似乎可以工作
输出:
^{pr2}$它可以用
BeautifulSoup
和这里的问题用户需要设置防刮剂
追加
tooltipstered
的类 你可以动态地删除它。使用
response.text
代替转义字符串response.content
。{cd5>元素列表不是空的
不必要的多行变量重写,可能是错误的列表树,你的意思是想 附加dict而不是
固定代码:
结果:
除了
selenium
,您还可以使用requests_html
来呈现页面。尽管你在问为什么你什么都没有得到,你的for-loop
是错的。这意味着您最终将得到空的footballer_list
,即使您已经运行了JavaScript并获得了完整的html代码。在相关问题 更多 >
编程相关推荐