使用代理爬网api获取相似的Web数据

similarweb-scraper的Python项目详细描述


相似刮刀

similarweb_scraperis是一个python库,用于使用proxyscrawlapi抓取similarweb,目前它可以绕过distil投影。它还提供了一些功能来将刮取的数据转换为pd数据帧。在

安装

使用包管理器pip安装foobar。在

pip install similarweb-scraper

## Usage

from similarweb_scraper import scraper

### get the website htmlweb_scrape= scraper()
web_scrape.login(#api key from proxycrawl.com)
web_scrape.webpage_scrape(#websit e.g: hk.yahoo.com)### get the html codesoup= web_scrape.og_soup
### get the html code as json formatweb_json= web_scrape.json_storage

### get data into json formatdf= web_scrape.metrics_to_df(#str(metrics_type))##metrics_type name :#'country_share',#'traffic_share',# engagement',#'monthly_traffic_data'# more function will be available soon

贡献

欢迎拉取请求。对于重大变化,请先打开一个问题,讨论您希望更改的内容。在

请确保根据需要更新测试。在

许可证

MIT

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
JFrame中的Java多线程   java Servlet异常映射   java无法从输出流读取   swing Java带来的小程序GUI问题   java什么原因导致错误“'void'类型此处不允许”以及如何修复它?   Java选择器select(长)与selectNow的区别   java自定义arraylist<mygames>获得不同   java Icepdf注释让页面消失   java反向整数数组   java I在生成同步“无法解析配置的所有依赖项”时遇到此错误:app:debugRuntimeClasspath   多个虚拟机上的java线程访问单个DB实例上的表,有时会导致性能低下和异常   swing更改Java中的默认按钮,使其看起来“更好”   java慢速MQ主题订阅。并行化不能提高性能   java运行Boggle Solver需要一个多小时。我的代码怎么了?   数据库中的java循环与应用程序中的java循环   正则表达式匹配${123…456}并在Java中提取2个数字?   java如何制作我们软件的试用版   Java内存参数计算   从另一个类调用方法时出现java问题