我需要历史收益日期,所以我想把它们从ychart.com网站. 我试着用下面的脚本取消苹果股票的收益日期(在上传图片的表格中)
import requests
url = 'https://ycharts.com/companies/AAPL/events/#/?eventTypes=earnings,&pageNum=1'
page = requests.get(url)
page_content = page.content
with open('data.txt', 'w') as f:
f.write(page_content)
f.close()
我把“页面内容”保存到一个文本文件中并搜索收入日期,但是我没有找到任何一个!在
你对脚本所做的就是从网页中获取HTML。 现在您需要解析HTML来获得所需的数据。 您可以使用lxml库或beautifulsoup甚至scrapy来进行一些web抓取。在
最后你应该在“日期”中列出日期。在
编辑:你没有得到任何执行这个脚本的东西,因为请求.get()检索HTML而不使用Javascript进行修改,该表由Javascript创建和填充。在
我的答案不适用于这个问题,它只是一个基本的网页抓取脚本。在
要从该页面获取数据,需要将selenium与python结合使用,因为该页面中的数据是动态生成的。但是,要从该页面获取内容,可以执行以下操作:
部分结果:
^{pr2}$相关问题 更多 >
编程相关推荐