从雅虎财经抓取数据

Traceback (most recent call last): File "C:\Users\nnarn\PycharmProjects\papaproject\main.py", line 15, in <module> print(str(parsePrice())) File "C:\Users\nnarn\PycharmProjects\papaproject\main.py", line 8, in parsePrice soup=bs4.BeautifulSoup(r.text, "xml") File "C:\Users\nnarn\AppData\Local\Programs\Python\Python39\lib\site-packages\bs4\__init__.py", line 243, in __init__ raise FeatureNotFound( bs4.FeatureNotFound: Couldn't find a tree builder with the features you requested: xml. Do you need to install a parser library?

import bs4 import requests from bs4 import BeautifulSoup def parsePrice(): r=requests.get('https://finance.yahoo.com/quote/FB?p=FB') soup=bs4.BeautifulSoup(r.text, "xml") price=soup.find('div',{'class':'D(ib) Mend(20px)'})[0].find('span').text print(price) return price while True: print(str(parsePrice()))

2条回答

网友

1楼 · 编辑于 2024-10-08 21:23:25

只需删除“xml”，您的soup.find也包含一个错误。首先find_all跨距，然后从列表中选择所需跨距：

import bs4
import requests

from bs4 import BeautifulSoup

def parsePrice():
    r=requests.get('https://finance.yahoo.com/quote/FB?p=FB')
    soup=bs4.BeautifulSoup(r.text)
    price=soup.find('div',{'class':'D(ib) Mend(20px)'}).find_all('span')[0].text
    print(price)
    return price

while True:
    print(str(parsePrice()))

网友

2楼 · 编辑于 2024-10-08 21:23:25

BS4 documentation建议您使用soup = BeautifulSoup(r.text, 'html.parser')，因为您正在下载的页面内容是HTML，而不是XML

相关问题更多 >

编程相关推荐

热门问题

热门文章