漂亮的汤蟒。从htm获取完整信息 - 问答 - Python中文网

漂亮的汤蟒。从htm获取完整信息

2024-05-07 18:57:36 发布

您现在位置：Python中文网/ 问答频道 /正文

男 | 程序猿一只，喜欢编程写python代码。

我想通过beauthulsoup获得我在电报上的帖子的浏览量。例如，我想从我的956号频道获取它：https://t.me/dayygesstt/956

<span class="tgme_widget_message_views">3.1K</span>

所以“3.1K”是我需要的。在

^{2}$

它打印出：

[<div class="tgme_page_widget" id="widget">
<script async="" data-telegram-post="dayygesstt/956" data-width="100%" src="https://telegram.org/js/telegram-
widget.js?4"></script>
</div>]

我试过不同的东西，但我不能得到更多的信息。请帮帮我，我做错什么了？如何正确获取信息？在

Tags： https div data js script 电报 widget 帖子

2条回答

网友

1楼 · 编辑于 2024-05-07 18:57:36

可以使用在脚本中加载iframe的URL。然后你只得到一个没有拐杖的小部件。为此，获取原始URL并附加一个查询字符串“embed=1”。在

import requests
from bs4 import BeautifulSoup

url = 'https://t.me/dayygesstt/956?embed=1'
r = requests.get(url)
soup = BeautifulSoup(r.text, "html.parser")
views = soup.find("span", {"class": "tgme_widget_message_views"})
print(views.text)

网友

2楼 · 编辑于 2024-05-07 18:57:36

我认为您需要定义与BeautifulSoup一起使用的解析器，以便它正确地解析HTML，所以这一行

soup=BeautifulSoup(html, )

需要这样

^{pr2}$

相关问题更多 >

编程相关推荐

热门问题

热门文章