从站点获取数据,在Python的主HTML文件中找不到

2024-06-26 01:37:30 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在使用python并提出一个请求: page = requests.get('http://www.finam.ru/profile/moex-akcii/aeroflot/news/?start-date=2016-01-01&end-date=2016-12-31',auth=('user', 'pass'))

我希望,我将能够找到一切,我可以看到,当我查看网站。但由于我对certian不了解,也不熟悉图书馆,我尝试手动检查:

  1. 我右击页面的随机部分,选择“显示页面代码”。实际上,我在那里找不到需要的信息
  2. 我右击页面的随机部分并选择“研究此元素”,我可以在wierd“树”结构中找到它: research this item

所以问题是,我收到哪个HTML文件,在发出请求时?以及如何从“树结构”中检索主题名。 完全没有HTML


Tags: httpgetdatehtmlwwwrupage页面
1条回答
网友
1楼 · 发布于 2024-06-26 01:37:30

除了源html之外,还有一个JavaScript代码在web站点上运行,它可以操作和更改DOM(您描述的树结构)。当您通过Python请求它时,JavaScript代码不会运行,因此您只能看到初始的html代码。做这种叫做刮削的事情,你可以用selenuim之类的工具来做

相关问题 更多 >