Python漂亮的汤表数据抓取特定的TD标签

2024-10-01 17:36:14 发布

您现在位置:Python中文网/ 问答频道 /正文

此网页上有多个表:http://www.nfl.com/player/tombrady/2504211/gamelogs。在

在HTML中,所有表的标签都完全相同:

<table class="data-table1" width="100%" border="0" summary="Game Logs For Tom Brady In 2014">

我只能从第一个表(季前赛表)中获取数据,但我不知道如何跳过第一个表(季前赛)而从第二个和第三个表(常规赛和季后赛)中获取数据。在

我在试着找出具体的数字。在

我的代码:

^{pr2}$

Tags: comhttp网页datahtmlwwwtable标签
2条回答

以下也应该起作用-

import pickle
import math
import urllib2
from lxml import etree
from bs4 import BeautifulSoup
from urllib import urlopen

year = '2014'
lastWeek = '2'
favQB1 = "Tom Brady"

favQBurl2 = 'http://www.nfl.com/player/tombrady/2504211/gamelogs'
favQBhtml2 = urlopen(favQBurl2).read()
favQBsoup2 = BeautifulSoup(favQBhtml2)
favQBpass2 = favQBsoup2.find_all("table", { "summary" : "Game Logs For %s In %s" % (favQB1, year)})[1]
favQBrows2 = []

for row in favQBpass2.findAll("tr"):
    if lastWeek in row.findNext('td'):
        for item in row.findAll("td"):
            favQBrows2.append(item.text)
print ("Enter: Starting Quarterback QB Rating of Favored Team for the last game played (regular season): "),
print favQBrows2[15]

依赖表标题,它位于第一个表行的td元素中:

def find_table(soup, label):
    return soup.find("td", text=label).find_parent("table", summary=True)

用法:

^{pr2}$

仅供参考,^{}文档参考。在

相关问题 更多 >

    热门问题