bingscraper是python3包,具有在搜索引擎“bing.com”上提取文本和图像内容的功能。

bingscraper的Python项目详细描述


刮刀

bingscraper是python3包,它提取搜索引擎bing.com上的文本和图像内容。

它可以帮助用户只获取有意义的结果和图像,以便进行搜索查询。它不下载广告内容,因此为用户保存数据。

在后台工作的脚本请求一个搜索项,并在脚本的根目录中创建一个目录(如果以前没有这样做的话),其中存储了相关特定搜索的所有内容。此脚本将下载超文本和指向该文本的超链接,并将其保存到自己创建的目录中的.txt文件中。此目录保存文本内容以及使用脚本下载的图像。

##要求 一。模块:

  1. requests: For requesting content through two HTTPS Methods: GET and POST. Used GET Method.
  2. BeautifulSoup: For creating JSON like dictionary using HTML Parser. Package uses bs4.
  3. os: For checking and making directories.
  4. PIL.Image: Pillow Module. For extracting image content.
  5. io.ByteIO: For saving the extracted image using the PIL.Image.
  1. internet连接:python包的正常功能需要持续的高速internet连接,因为它不断地将图像的副本创建到本地机器中。
  2. python:3.6.4或更高版本。这个包是用python 3.6.4编写的

##如何使用

安装上述模块。成功导入bingscraper仅取决于上述导入之后。

python中的示例代码:

将bingscraper导入为bs

搜索=str(input())

bs.scrape(search).text();用于文本删除。

bs.scrape(search.image();用于图像擦除。

scrape()接受一个字符串参数,.text()或.image()执行抓取工作。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
CentOS上的java Spring Boot简易应用程序需要很长时间才能启动   java如何检查字符串值是否等于null?   收集器中的java映射值。分组方式()   java需要支持Azure AD B2C webapp集成   java如何加入线程以停止它?   java如何使用意图传递类的对象?   java如何在战争环境中发现CDI生产者?   多模块项目中java奇怪的编译器行为   java如何在web应用程序中管理密码?   java从http服务器、filehandler中删除冗余代码   java使用反射来获取泛型类的字段   java Spring MVC/Hibernate/MySQL 400错误请求错误   给定正整数a的java幂为3   在Java中将元素拆分为不同数量的列表?   java展开折叠窗格