搜索网站关键字的实用程序

analyze_site的Python项目详细描述


analyze_site是一个python应用程序,用于对网站进行爬网并返回在网站网页中找到的文件中提供的关键字的计数。应用程序还将返回最常用的动词、名词、副词和形容词的计数。

analyze_站点需要python版本3和以下库:

  • nltk-带有maxent_treebank_pos_tagger的自然语言工具包
用法:analyze\u site.py[-h][-d depth][-r path\u regex][–verbose]
关键字文件URL
位置参数:
关键字文件路径到关键字文件 要爬网的URL
可选参数:
-h, --helpshow this help message and exit
-d DEPTH, --depth DEPTH
Depth to crawl
-r PATH_REGEX, --path_regex PATH_REGEX
Regular expression to match URL
--verboseIncrease logging level

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java文件分块,获取长度字节   java嵌入式Tomcat不执行jsf页面   java我的数据库中有2个实体,但hibernate返回其中6个。   java如何基于逗号拆分字符串   java取消已经运行的CompletableFutures的预期模式是什么   java如何在informix中从另一个数据库复制表ddl和数据   为什么图片是黑色的?   java根据字符串数组中的单词筛选列表   Java8的集合。平行流有效吗?   Kotlin中的java静态内部类   java如何在GUI中生成一列字符串   javafx如何正确使用高对比度主题?   带空格的javascript Httpurlconnection参数   java如何设置GridBagLayout的约束   java如何在一个线程可能尚未初始化时关闭另一个线程   java将简单时间格式转换为特殊时间格式(hhmmt)   安卓/java阵列重复过滤器的问题   java在队列的链接实现下,入队和出队是如何工作的   java更新sql外键约束