附加要求

DocuScan的Python项目详细描述


docuscan包

docuscan是一种轻量级的文档扫描仪。

docuscan允许用户打开文档类型docx、doc、pdf并将其中的信息作为字符串返回。

docuscan还允许通过正则表达式处理这些信息。

Check out my other projects!

要求:

  1. zipfile

  2. IO

  3. 回复

  4. XML

安装:

  1. 运行pip install docuscan

  2. 导入文档

用法:

  1. 类docuscan('filename')到变量。

###值得注意的是,文件名必须在目录中。

  1. 使用print(variable.returnFileText())

  2. 使用print(variable.executegex('regex here'))

  3. 使用print(executeheaderregex('regex here'))

  4. 使用print(executefooterregex('regex here'))

功能:

  1. returnFileText()-返回文件的文本。

  2. executegex(regexexpression)-创建regexexpression的所有匹配案例的列表

  3. executeHeaderRegex(regularExpression)-在头XML中创建regexExpression的所有匹配案例的列表。

  4. executefooterregex(regularexpression)-在页脚xml中创建regexexpression的所有匹配大小写的列表。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java我能在这个程序中更好地使用内存吗?   为什么我的Java while循环迭代了一半   java IntelliJ IDEA不在构建时复制资源   socket仅在Java TCP服务器输出上检查客户端断开连接   java游戏物理摩擦   java片段onClick调用方法   symja数学分析器中无法识别java Abs[x]   java在使用泛型时创建二进制搜索树类的实例?   java在外键约束表上的添加和删除   语法java表达式的含义,如果有条件   java创建内联对象并作为参数传递   是否有相当于Redis排序集(zset)的Java数据结构   java找不到适合的方法(无参数)   音频文件操作给定字节帧的音量Java   Eclipse4不以JavaWebStart启动   java如何使用org在JSON对象中获取嵌套的键元素。json?   java与Jackson的反序列化:“org.codehaus.Jackson.map.JsonMappingException:无法反序列化[projectname]的实例。”   字符串的Java正则表达式   spring集成上的java检测缺火指令