擅长:python、mysql、java
<p>你对脚本所做的就是从网页中获取HTML。
现在您需要解析HTML来获得所需的数据。
您可以使用lxml库或beautifulsoup甚至scrapy来进行一些web抓取。在</p>
<pre><code>from lxml import html
import requests
url = 'https://ycharts.com/companies/AAPL/events/#/?eventTypes=earnings,&pageNum=1'
page = requests.get(url)
page_content = page.content
tree = html.fromstring(page_content)
my_xpath = '//th[@class="colDate ng-binding"]/text()'
dates = tree.xpath(my_xpath)
for date in dates:
print("{}".format(date))
</code></pre>
<p>最后你应该在“日期”中列出日期。在</p>
<p>编辑:你没有得到任何执行这个脚本的东西,因为请求.get()检索HTML而不使用Javascript进行修改,该表由Javascript创建和填充。在</p>
<p>我的答案不适用于这个问题,它只是一个基本的网页抓取脚本。在</p>