轻量级python模块,允许从opendocument(odt)文件中提取文本。
ODTReader的Python项目详细描述
用于从opendocument(odt)文件中提取原始文本的轻量级python模块。
支持Linux、MacOS和Windows平台。
只要指向扩展名为.odt的文件,让它为您打印出来。
安装
$ pip install odtreader
用法
您只需调用odtToText()函数即可使用它。文件被解析,文本作为unicode对象返回给您。
示例:
fromODTReader.odtreaderimportodtToTexttext=odtToText("path/to/file.odt")
它还可以用作命令行实用程序。
示例:
$ python odtreader.py path/to/file.odt This is the contents of the odt file! $ python odtreader.py path/to/file.odt -o outfile.txt Contents written to 'outfile.txt'
版本支持
到目前为止,这个模块只支持Python2.7。
许可证
GNU GPL v3.0 License,请参阅许可证文件。