我有以下代码,我试图从这个MLB网站(http://www.espn.com/mlb/boxscore?gameId=370403101)获取玩家统计信息:
from selenium import webdriver
link = 'http://www.espn.com/mlb/boxscore?gameId=370403101'
driver = webdriver.Chrome('/PATH/chromedriver')
driver.get(link)
player_name_away = driver.find_element_by_xpath('//*[@id="gamepackage-box-score"]/div/div[2]/div[1]/article[1]/div/table[1]/tbody[1]/tr/td[1]/a/span').text
ab_away = driver.find_element_by_xpath('//*[@id="gamepackage-box-score"]/div/div[2]/div[1]/article[1]/div/table[1]/tbody[1]/tr/td[3]').text
run_away = driver.find_element_by_xpath('//*[@id="gamepackage-box-score"]/div/div[2]/div[1]/article[1]/div/table[1]/tbody[1]/tr/td[4]').text
hit_away = driver.find_element_by_xpath('//*[@id="gamepackage-box-score"]/div/div[2]/div[1]/article[1]/div/table[1]/tbody[1]/tr/td[5]').text
rbi_away = driver.find_element_by_xpath('//*[@id="gamepackage-box-score"]/div/div[2]/div[1]/article[1]/div/table[1]/tbody[1]/tr/td[6]').text
bb_away = driver.find_element_by_xpath('//*[@id="gamepackage-box-score"]/div/div[2]/div[1]/article[1]/div/table[1]/tbody[1]/tr/td[7]').text
strk_away = driver.find_element_by_xpath('//*[@id="gamepackage-box-score"]/div/div[2]/div[1]/article[1]/div/table[1]/tbody[1]/tr/td[8]').text
p_val_away = driver.find_element_by_xpath('//*[@id="gamepackage-box-score"]/div/div[2]/div[1]/article[1]/div/table[1]/tbody[1]/tr/td[9]').text
avg_away = driver.find_element_by_xpath('//*[@id="gamepackage-box-score"]/div/div[2]/div[1]/article[1]/div/table[1]/tbody[1]/tr/td[10]').text
obp_away = driver.find_element_by_xpath('//*[@id="gamepackage-box-score"]/div/div[2]/div[1]/article[1]/div/table[1]/tbody[1]/tr/td[11]').text
slg_away = driver.find_element_by_xpath('//*[@id="gamepackage-box-score"]/div/div[2]/div[1]/article[1]/div/table[1]/tbody[1]/tr/td[12]').text
driver.close()
val_list_away = [player_name_away, ab_away, run_away, hit_away, rbi_away, bb_away, strk_away,
p_val_away, avg_away, obp_away, slg_away]
print(val_list_away)
但是,当我运行代码时,我会得到以下列表:
^{pr2}$^{cd1>}、^{cd2>}、^{cd3>}和^{{cd4>}的值丢失,但是,如下图所示,硒应该可以访问html代码。有人能帮忙吗?谢谢您!
假设未来您可能需要从几个表中提取几个玩家的统计信息,我对您的程序进行了如下修改:
代码块:
控制台输出:
^{2美元注意:在UI中,列标题p及其值16都无法提取。在
您可以使用
selenium
来加载页面,然后使用BeautifulSoup
来查找播放器属性:输出:
^{pr2}$结果还生成
"D. Travis"
的完整统计信息:相关问题 更多 >
编程相关推荐