如何在span类中python抓取文本

网友

1楼 · 编辑于 2024-10-16 17:25:53

试试像Selenium Firefox这样的真正的浏览器。我试图使用Selenium PhantomJS，但失败了。。。在

from selenium import webdriver
from bs4 import BeautifulSoup
from time import sleep

url = 'https://www.gdax.com/trade/BTC-USD'

driver = webdriver.Firefox(executable_path='./geckodriver')

driver.get(url)
sleep(10) # Sleep 10 seconds while waiting for the page to load...

html = driver.page_source
soup = BeautifulSoup(html, "lxml") 
spans=soup.find_all('span', {'class': 'MarketInfo_market-num_1lAXs'})
for span in spans:
    print(span.text.replace('USD','').strip())

driver.close()

输出：

^{pr2}$

网友

2楼 · 编辑于 2024-10-16 17:25:53

你只需搜索正确的标签和类别-

from bs4 import BeautifulSoup

html_text = """
<span class="MarketInfo_market-num_1lAXs"> 11,511.31 USD </span>
"""

html = BeautifulSoup(html_text, "lxml")

spans = html.find_all('span', {'class': 'MarketInfo_market-num_1lAXs'})
for span in spans:
    print(span.text.replace('USD', '').strip())

搜索所有<span>标记，然后按class属性过滤它们，在本例中，该属性的值为MarketInfo_market-num_1lAXs。过滤器完成后，只需在跨度中循环，并使用.text属性来检索文本，然后只需替换“USD”。在

更新

^{pr2}$

不需要理解HTML。HTML标记中的数据是从具有JSON响应的API调用填充的。你可以直接调用这个API。这将使您的数据保持最新。在

网友

3楼 · 编辑于 2024-10-16 17:25:53

您可以使用beautifulsoup或lxml。在

对于beauthulsoup，代码如下

from bs4 import BeautifulSoup

soup = BeautifulSoup("""<span class="MarketInfo_market-num_1lAXs"> 11,511.31 USD </span>""", "lxml")

print(soup.string)

lxml更快

^{pr2}$

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何在span类中python抓取文本

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >