F.A.S.T.Package for describing databases
fast-curator的Python项目详细描述
快速馆长
创建、读取和写入要处理的输入数据集的字典描述。 目前,所有的数据集都是从根树集合构建的。
要求
安装
pip install --user fast-curator
用法
# Local files:
fast_curator -o output_file_list.txt -t tree_name -d dataset_name --mc input/files/*root
# Single XROOTD files:
fast_curator -o output_file_list.txt --mc root://my.domain.with.files://input/files/one_file.root
# XROOTD files with several globs
fast_curator -o output_file_list.txt --mc root://my.domain.with.files://inp*/files/*.root
注意:
- 如果使用相同的输出文件多次调用该命令(使用
-o
选项),则指定的其他文件将附加到输出文件中。 - 可以将任意元数据(例如横截面、数据质量、生成器精度等)添加到每个数据集中
-m
选项。
有关更多指导,请尝试内置帮助:
fast_curator --help
读取数据集文件
import fast_curator
datasets = fast_curator.read.from_yaml("my_dataset_file.yml")
将返回应用于每个数据集的default
节的数据集列表。
其他文档
正在路上…