bingscraper是python3包,具有在搜索引擎“bing.com”上提取文本和图像内容的功能。
bingscraper的Python项目详细描述
- 刮刀
bingscraper是python3包,它提取搜索引擎bing.com上的文本和图像内容。
它可以帮助用户只获取有意义的结果和图像,以便进行搜索查询。它不下载广告内容,因此为用户保存数据。
在后台工作的脚本请求一个搜索项,并在脚本的根目录中创建一个目录(如果以前没有这样做的话),其中存储了相关特定搜索的所有内容。此脚本将下载超文本和指向该文本的超链接,并将其保存到自己创建的目录中的.txt文件中。此目录保存文本内容以及使用脚本下载的图像。
##要求 一。模块:
- requests: For requesting content through two HTTPS Methods: GET and POST. Used GET Method.
- BeautifulSoup: For creating JSON like dictionary using HTML Parser. Package uses bs4.
- os: For checking and making directories.
- PIL.Image: Pillow Module. For extracting image content.
- io.ByteIO: For saving the extracted image using the PIL.Image.
- internet连接:python包的正常功能需要持续的高速internet连接,因为它不断地将图像的副本创建到本地机器中。
- python:3.6.4或更高版本。这个包是用python 3.6.4编写的
##如何使用
安装上述模块。成功导入bingscraper仅取决于上述导入之后。
python中的示例代码:
将bingscraper导入为bs
搜索=str(input())
bs.scrape(search).text();用于文本删除。
bs.scrape(search.image();用于图像擦除。
scrape()接受一个字符串参数,.text()或.image()执行抓取工作。