我需要从网页http://www.aastocks.com/tc/stocks/news/aafn/result-announcement的左下部分提取新闻标题和内容(如果有的话)
我的代码能够提取网页左下部分的第一部分。但是,我无法从视口外部提取数据(第2页、第3页等等)
新闻标题示例:
長城微光(08286.HK)首三季虧轉盈賺65.2萬元人民幣
如何从这些附加页中提取数据
result = requests.get("http://www.aastocks.com/tc/stocks/news/aafn/result-announcement")
result.raise_for_status()
result.encoding = "utf-8"
src = result.content
soup = BeautifulSoup(src, 'lxml')
print(soup)
news = []
for a_tag in soup.find_all('a'):
news.append(a_tag.text)
df = df.append(pd.DataFrame(news, columns=['News']))
print(news)
目前没有回答
相关问题 更多 >
编程相关推荐