我试图用Python中的BeautifulSoup解析网页http://www.baseball-reference.com/teams/BOS/2000-pitching.shtml中的信息。我想在“团队投球”表格中打印出每个球员的相应姓名。但是,代码在某个特定的名字后面重复了球员的名字(在本例中,在第15行之后,它重复了“Pedro Martinez”)的名字。例如:
1 Pedro Martinez
2 Jeff Fassero*
3 Ramon Martinez
4 Pete Schourek*
5 Rolando Arrojo
6 Tomo Ohka
7 Derek Lowe
8 Tim Wakefield
9 Rich Garces
10 Rheal Cormier*
11 Hipolito Pichardo
12 Brian Rose
13 Bryce Florie
14 John Wasdin
15 Pedro Martinez
16 Jeff Fassero*
17 Ramon Martinez
18 Pete Schourek*
19 Rolando Arrojo
20 Tomo Ohka
21 Derek Lowe
22 Tim Wakefield
23 Rich Garces
24 Rheal Cormier*
25 Hipolito Pichardo
26 Brian Rose
27 Bryce Florie
28 John Wasdin
你知道发生了什么事吗?这是我的代码:
^{pr2}$
您试图遍历表中的所有行,而不是先获取所有表标记。因此,如果有意义的话,可以获取所有的table标记,然后遍历table标记中的所有tr标记。而且}是未定义的,所以我假设年份是}。另外,您不必下载HTML,然后打开它来解析它,您只需通过获取连接的文本并直接解析来获得HTML。在
year
和{y
,并使table
变量{相关问题 更多 >
编程相关推荐