docx模块创建、读取和写入Microsoft Office Word 2007 docx文件

docx的Python项目详细描述


简介

docx模块创建、读取和写入Microsoft Office Word 2007 docx 文件夹。

它们被称为“wordml”、“office open xml”和“open xml” 微软。

这些文档可以在Microsoft Office 2007/2010、Microsoft Mac中打开 Office 2008、Google Docs、OpenOffice.org 3和Apple iWork 08。

他们也validate as well formed XML

该模块是在我寻找对ms-word的python支持时创建的 .docx文件,但只能找到涉及COM自动化的各种黑客, 调用.NET或Java,或自动化OpenOffice或MS Office。

docx模块具有以下功能:

制作文件

制作文档的功能包括:

  • 段落
  • 项目符号
  • 编号列表
  • 文档属性(作者、公司等)
  • 多级标题
  • 表格
  • 分节和分页符
  • 图像
http://github.com/mikemaccana/python-docx/raw/master/screenshot.png

编辑文档

由于LXML模块的卓越性,我们可以:

  • 搜索并替换
  • 提取文档的纯文本
  • 在文档中的任何位置添加和删除项目
  • 更改文档属性
  • 对文档中的特定位置运行xpath查询-对于 正在从用户完成的模板中检索数据。

开始

制作和修改文档

  • 只是download python docx

  • 使用pipeasy_install获取lxmlpil模块。

  • 然后运行:

    example-makedocument.py
    

恭喜你,你刚刚制作并修改了一个word文档!

从文档中提取文本

如果只想从word文件中提取文本,请运行:

example-extracttext.py 'Some word file.docx' 'new file.txt'

想法和待办事项列表
  • 图像处理的进一步改进
  • 记录健康检查
  • 鸡蛋
  • 降价转换支持

我们喜欢叉子、更改和拉取请求!

  • 查看[黑客](hacking.markdown)以添加您自己的更改!
  • 对于github上的这个项目
  • 通过github发送拉取请求,我们将添加您的更改!
想谈谈吗?需要帮助吗?

电子邮件python-docx@googlegroups.com

许可证

根据MIT license

授权

简短版本:这段代码是我的版权(迈克麦卡纳),我给你 允许对它做你想做的事,除了从信用卡中删除我的名字。 具体条款见许可文件。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java连接usb到uart设备到安卓设备>3.1   可以强制Php中的web应用程序与Java中的桌面应用程序一起工作吗?   java为什么自定义系统类加载器不工作?   数组在Java中解析具有多个分隔符的字符串   PMD Java 8德米特定律   JavaSpringMVC表单验证不适用于嵌套的复杂类型   让Eclipse Java组织导入以使用Google checkstyle   java Appium:无法创建新会话   java如何在数组中声明新字段   java如何解决“无法初始化类org.apache.cassandra.config.DatabaseDescriptor”?   java AsyncTask创建socket   java向@CreatedBy添加更多信息   如何在ubuntu中运行包含大量jars依赖项的java文件   java如何使用<s:select>标记并在中休眠来填充下拉列表?   java获取错误:找不到符号变量“level”和“next_level_button”   javaweb应用中基于UI的ajax显示代码流   Java长到MySql   java JvisualVM:奇怪的应用程序行为   ubuntu将Java程序的输出结果保存到一个文件中