我正试图从网页内的url中获取数据(insta id和粉丝数):, https://starngage.com/app/global/influencer/ranking/india
url的元素id为:@priyankachopra
类似地,我想从同一个表中的所有链接中刮取数据
有人能告诉我怎么做吗
import requests
from bs4 import BeautifulSoup as bs
r = requests.get("https://starngage.com/app/global/influencer/ranking/india")
一些JavaScript被用于呈现表,因此
requests
无法获取表html。相反,使用selenium
模拟web浏览器访问站点,然后将page_source
传递给BeautifulSoup
然后我遍历表中的行,将每个}
insta_id
和follower_count
保存到字典列表中,然后将所有内容转换为pandas
{您可以直接在HTML中找到数据。只需使用
beautifulsoup
即可提取所需的数据这是代码
相关问题 更多 >
编程相关推荐