拉网助手

import pandas as pd import requests from bs4 import BeautifulSoup url = 'https://www.nasdaq.com/market-activity/funds-and-etfs/qqq/historical' page = requests.get(url) soup = BeautifulSoup(page.text, 'html.parser')

File "<ipython-input-94-f3a234b1eafd>", line 1, in <module> df = pd.read_html(str(soup.select('historical-data__table'))) File "C:\Anaconda3\lib\site-packages\pandas\io\html.py", line 1094, in read_html displayed_only=displayed_only) File "C:\Anaconda3\lib\site-packages\pandas\io\html.py", line 916, in _parse raise_with_traceback(retained) File "C:\Anaconda3\lib\site-packages\pandas\compat\__init__.py", line 420, in raise_with_traceback raise exc.with_traceback(traceback) ValueError: No tables found

2条回答

网友

1楼 · 编辑于 2024-05-18 05:38:01

这个数据来自一个API，它是https://api.nasdaq.com/api/quote/QQQ/historical?assetclass=etf&fromdate=2019-09-11&limit=18&todate=2019-10-11

您可以使用python-requests直接获取它：

import requests

response = requests.get(
    'https://api.nasdaq.com/api/quote/QQQ/historical',
    params = {
        'assetclass':'etf',
        'fromdate':'2019-09-11',
        'todate': '2019-10-11',
        'limit': 18
    }
)
print(response.json()['data']['tradesTable']['rows'])

网友

2楼 · 编辑于 2024-05-18 05:38:01

我只是按原样尝试了你的脚本并查看了输出。看起来您要查找的内容没有被提取，这表明它是通过javascript动态生成的。BeautifulSoup不具备处理动态内容的能力，因为它只能读取立即加载的数据，而javascript可以在文档准备就绪时加载内容。我会调查硒。你知道吗

相关问题更多 >

编程相关推荐

热门问题

热门文章

拉网助手

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >