ASReview项目的统计工具
asreview-statistics的Python项目详细描述
ASReview统计
用于生成状态文件和数据集统计信息的ASReview扩展。在
总则
安装软件包时:
pip install asreview-statistics
软件包的一般用途是对相关文件进行系统的检查 用ASReview。它可以用来检查您想要查看的数据集(或 已审核)。在
一般用法:
^{pr2}$数据集
在命令行上使用以下命令:
asreview stat path_to_your_dataset
它应该给出数据集的一些一般属性,例如:
************ PTSD_VandeSchoot_18.csv ************
Number of papers: 5782
Number of inclusions: 38 (0.66%)
Number of exclusions: 5744 (99.34%)
Number of unlabeled: 0 (0.00%)
Average title length: 101
Average abstract length: 1339
Average number of keywords: 8.8
Number of missing titles: 64 (of which 0 included)
Number of missing abstracts: 747 (of which 0 included)
数据集的格式应能被ASReview软件读取。文档 关于如何创建这样的数据集在主项目中。在
状态文件
另一个用途是快速分析同一个状态文件或多个状态文件 目录:
asreview stat path_to_your_state_files
这将产生类似于:
************ ptsd_nb *******************
----------- general -----------
Number of runs : 16
Number of papers : 5782
Number of included papers : 38
Number of excluded papers : 5744
Number of unlabeled papers: 0
Number of queries : 233
----------- settings -----------
model : nb
query_strategy : max_random
balance_strategy : double
feature_extraction: tfidf
n_instances : 25
n_prior_included : 1
n_prior_excluded : 1
mode : simulate
model_param : {'alpha': 3.822}
query_param : {'strategy_1': 'max', 'strategy_2': 'random', 'mix_ratio': 0.95}
feature_param : {}
balance_param : {'a': 2.155, 'alpha': 0.94, 'b': 0.789, 'beta': 1.0}
abstract_only : False
----------- WSS/RRF -----------
WSS@95 : 91.50 %
WSS@100: 87.56 %
RRF@5 : 97.30 %
RRF@10 : 97.64 %
目前,显示的信息量正在增长;欢迎提供帮助和建议!在
- 项目
标签: