将html刮入csv fi

1条回答

网友

1楼 · 发布于 2024-09-25 00:32:49

不知道为什么不按照this answer中为上一个问题建议的代码-它实际上解决了将字段分组在一起的问题。在

下面是将track、date和{}转储到csv的后续代码：

import csv

from bs4 import BeautifulSoup
import requests


html = requests.get("http://www.gbgb.org.uk/resultsMeeting.aspx?id=135754").text
soup = BeautifulSoup(html, 'lxml')

rows = []
for header in soup.find_all("div", class_="resultsBlockHeader"):
    track = header.find("div", class_="track").get_text(strip=True).encode('ascii', 'ignore').strip("|")
    date = header.find("div", class_="date").get_text(strip=True).encode('ascii', 'ignore').strip("|")

    results = header.find_next_sibling("div", class_="resultsBlock").find_all("ul", class_="line1")
    for result in results:
        greyhound = result.find("li", class_="greyhound").get_text(strip=True)

        rows.append({
            "track": track,
            "date": date,
            "greyhound": greyhound
        })


with open("results.csv", "w") as f:
    writer = csv.DictWriter(f, ["track", "date", "greyhound"])

    for row in rows:
        writer.writerow(row)

运行代码后results.csv的内容：

^{pr2}$

请注意，我在这里使用^{}，但是如果您愿意，可以使用urllib2。在

相关问题更多 >

编程相关推荐

热门问题

热门文章

将html刮入csv fi

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >