如何使用Python从财经网站中提取股票新闻标题和内容?

2024-10-06 07:16:54 发布

您现在位置:Python中文网/ 问答频道 /正文

我需要从网页http://www.aastocks.com/tc/stocks/news/aafn/result-announcement的左下部分提取新闻标题和内容(如果有的话)

我的代码能够提取网页左下部分的第一部分。但是,我无法从视口外部提取数据(第2页、第3页等等)

新闻标题示例:

長城微光(08286.HK)首三季虧轉盈賺65.2萬元人民幣

如何从这些附加页中提取数据

result = requests.get("http://www.aastocks.com/tc/stocks/news/aafn/result-announcement")
result.raise_for_status()
result.encoding = "utf-8"
src = result.content
soup = BeautifulSoup(src, 'lxml')

print(soup)
news = []
for a_tag in soup.find_all('a'):
    news.append(a_tag.text)
df = df.append(pd.DataFrame(news, columns=['News']))
print(news)

Tags: 数据comhttp网页forwwwresultnews