如何使用BeautifulSoup从特定字符串解析表？

def airtm(): #URLs y ejecución de BS url = requests.get("https://airtmrates.com/") response = requests.get(url) html = response.content soup_ = soup(url, 'html.parser') columns = soup_.findAll('td', text = re.compile('VES'), attrs = {'::before'}) return columns

1条回答

网友

1楼 · 发布于 2024-09-28 20:50:18

页面是动态的，这意味着您需要在解析之前呈现页面。你可以用Selenium或Requests-HTML来做

我不太熟悉HTML请求，但我过去使用过Selenium。这会让你走的。而且，每当我想拉一个<table>标签时，我喜欢用pandas来解析。但是BeautifulSoup仍然可以使用，只是需要更多的工作来遍历table、tr、td标记。熊猫可以通过.read_html()为您完成这项工作：

from selenium import webdriver
import pandas as pd


def airtm(url):
    #URLs y ejecución de BS
    driver = webdriver.Chrome("C:/chromedriver_win32/chromedriver.exe")
    driver.get(url)

    tables = pd.read_html(driver.page_source)
    df  = tables[0]
    df = df[df['Code'] == 'VES']

    driver.close()
    return df

results = airtm('https://airtmrates.com/')

输出：

print (results)
    Code              Name         Method    Rate      Buy     Sell
120  VES  Bolivar Soberano           Bank  2526.7  2687.98  2383.68
143  VES  Bolivar Soberano   Mercado Pago  2526.7  2631.98  2429.52
264  VES  Bolivar Soberano      MoneyGram  2526.7  2776.59  2339.54
455  VES  Bolivar Soberano  Western Union  2526.7  2746.41  2383.68

相关问题更多 >

编程相关推荐

热门问题

热门文章