基于wikiprojects的自动检测wikipedia新草稿主题的库。

drafttopic的Python项目详细描述


#主题草稿

根据英文维基百科上的wikiprojects预测新草稿的主题。

##设置

确保有一个工作的python3环境。 使用以下命令安装要求:

` pip install -r requirements `

使用以下命令安装库:

` python setup.py install `

##生成机器可读的wikiprojects数据

从根目录使用以下实用程序生成机器可读的wikiprojects数据:

` ./utility fetch_wikiprojects --output <output_file_name.json> `

##生成中级类别到wikiprojects的映射

使用根目录中的以下实用程序生成高级主题类别到其中包含的WikiProject列表的映射:

` ./utility trim_wikiprojects --wikiprojects wp --output outmid `

##使用每个页面所属的wikiprojects和中级类别标记页面id列表

使用根目录中的以下实用程序,用wikiprojects和页面所属的中级类别标记页面id列表。

` ./utility fetch_page_wikiprojects --api-host=https://en.wikipedia.org/--input=wikiproject_page_ids.json--output=enwiki.labeled_wikiprojects.json--mid_level_wp=outmid.json--verbose `

在上面,脚本的输入应该是一个json,其中包含 观察,每个观察都有一个页id:<;页id>;映射。 此外,还要将脚本的中级wikiprojects json传递给 生成wikiprojects到中级类别的映射。剧本增加了 给定包含所述字段的列表,将其写入由指定的新文件 “输出”

##在Wikipedia上生成一组页ID的预测

要为一组修订id生成主题预测,请下载相关模型并使用revscoring的[score](https://github.com/wikimedia/revscoring/blob/master/revscoring/utilities/score.py)api 产生预测。请注意,修订标识需要位于api指定格式的文件中。使用页面的最新修订的修订ID可以获得良好的预测。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
CentOS上的java Spring Boot简易应用程序需要很长时间才能启动   java如何检查字符串值是否等于null?   收集器中的java映射值。分组方式()   java需要支持Azure AD B2C webapp集成   java如何加入线程以停止它?   java如何使用意图传递类的对象?   java如何在战争环境中发现CDI生产者?   多模块项目中java奇怪的编译器行为   java如何在web应用程序中管理密码?   java从http服务器、filehandler中删除冗余代码   java使用反射来获取泛型类的字段   java Spring MVC/Hibernate/MySQL 400错误请求错误   给定正整数a的java幂为3   在Java中将元素拆分为不同数量的列表?   java展开折叠窗格