我正在使用python并提出一个请求:
page = requests.get('http://www.finam.ru/profile/moex-akcii/aeroflot/news/?start-date=2016-01-01&end-date=2016-12-31',auth=('user', 'pass'))
我希望,我将能够找到一切,我可以看到,当我查看网站。但由于我对certian不了解,也不熟悉图书馆,我尝试手动检查:
所以问题是,我收到哪个HTML文件,在发出请求时?以及如何从“树结构”中检索主题名。 完全没有HTML
除了源html之外,还有一个JavaScript代码在web站点上运行,它可以操作和更改DOM(您描述的树结构)。当您通过Python请求它时,JavaScript代码不会运行,因此您只能看到初始的html代码。做这种叫做刮削的事情,你可以用selenuim之类的工具来做
相关问题 更多 >
编程相关推荐