如何在网上搜刮所有的击球手的名字？

#import modules from urllib.request import urlopen from lxml import html #fetch url/html response = urlopen("https://www.baseball-reference.com/leagues/MLB/2018-standard-batting.shtml") content = response.read() tree = html.fromstring( content ) #parse data comment_html = tree.xpath('//comment()[contains(., "players_standard_batting")]')[0] comment_html = str(comment_html).replace("-->", "") comment_html = comment_html.replace("<!--", "") tree = html.fromstring( comment_html ) for batter_row in tree.xpath('//table[@id="players_standard_batting"]/tbody/tr[contains(@class, "full_table")]'): csk = batter_row.xpath('./td[@data-stat="player"]/@csk')[0]

bat_data = [csk] string = '0.01' result = [] for x in bat_data : if string in x: substring = x.replace(string,'') if substring != "": result.append(substring) else: result.append(x) print(result)

3条回答

网友

1楼 · 编辑于 2024-09-27 23:15:41

1）打印所有击球手姓名

print(result)

这将打印结果对象中的所有内容。如果它没有打印出你所期望的内容，那么就有别的问题发生了。你知道吗

2）删除引号括号是因为它是数组对象。试试这个。。。你知道吗

print(result[0])

这将告诉解释器在0索引处打印结果。你知道吗

3）姓名的倒序

试试看

name = result[0].split(“ “).reverse()[::-1]

网友
2楼 · 编辑于 2024-09-27 23:15:41

你可以用不同的方法做同样的事情。这里有一个这样的方法，它不需要后期处理。你得到你想要的名字：
from urllib.request import urlopen from lxml.html import fromstring url = "https://www.baseball-reference.com/leagues/MLB/2018-standard-batting.shtml" content = str(urlopen(url).read()) comment = content.replace(" >","").replace("<! ","") tree = fromstring(comment) for batter_row in tree.xpath('//table[contains(@class,"stats_table")]//tr[contains(@class,"full_table")]'): csk = batter_row.xpath('.//td[@data-stat="player"]/a')[0].text print(csk)
输出结果如下：
Jose Abreu Ronald Acuna Jason Adam Willy Adames Austin L. Adams

网友
3楼 · 编辑于 2024-09-27 23:15:41

你只得到最后一个击球手，因为你在第一个循环中每次都会覆盖csk的值。首先初始化空列表bat\ U数据，然后将每个BATT添加到其中。你知道吗

bat_data= []
for batter_row in blah:
    csk = blah
    bat_data.append(csk)

这会给你一个所有击球手的列表，['Abreu,Jose0.01', 'Acuna,Ronald0.01', 'Adam,Jason0.01', ...]

然后循环浏览这个列表，但不必检查名称中是否有string。只需执行x.replace('0.01', '')，然后检查字符串是否为空。你知道吗

颠倒名字的顺序

substring = substring.split(',')
substring.reverse()
nn = " ".join(substring)

然后将nn附加到结果。你知道吗

你得到的是引号和括号，因为你正在打印列表。而是遍历列表并打印每个项目。你知道吗

您的代码被编辑，假设您正确获得了bat_数据：

for x in bat_data :
    substring = x.replace(string,'')
    if substring != "":
        substring = substring.split(',')
        substring.reverse()
        substring = ' '.join(substring)
        result.append(substring)

for x in result:
    print(x)

相关问题更多 >

编程相关推荐

热门问题

热门文章