简单文件集合分析框架
sficopaf的Python项目详细描述
主要功能
- 声明性的 :首先定义要分析的对象的类型 创建一个类,然后使用 parse_collection 或 在适当的文件夹或文件路径上分析项目 。
- 支持同一对象类型的多个单一文件分析器。 由于结合了 {type+extension} 注册,您可以注册 给定对象类型的单一文件分析器 扩展名(例如 str + .txt )。这允许用户 为同一对象类型注册多个解析器,支持 由扩展名表示的格式。
- 支持复杂类 :此框架的主要兴趣是 它能够定义跨越多个 文件夹。例如,一个包含两个字段的类 输入:dataframe 和 预期输出:str 。班级 对构造函数进行了内省,以便找到所需的 和 可选字段及其名称。字段可以是对象或 集合(应该用 输入 模块声明 作为dict[str,foo])以便框架跟踪 基本集合类型)
- 递归 :字段本身可能是集合或复杂类型。 在这种情况下,它们由多个文件表示。
- 支持两种主要的文件映射风格:
- 平面 ,其中所有项都表示为相同的文件 文件夹(偶数个字段和集合元素)
- 包装的 ,其中表示集合或复杂的所有项 类型由文件夹表示,所有准备分析的项都是 由文件表示。