Python使用mammoth将docx转换为html:html，缺少head和body标记

1条回答

网友

1楼 · 发布于 2024-06-26 04:27:12

我阅读了文档，还没有找到生成完整HTML的选项。由于生成的HTML只是一个sting，因此很容易使其完全兼容HTML：

import mammoth

with open("test.docx", "rb") as docx_file:
    result = mammoth.convert_to_html(docx_file)
    html = result.value  # The generated HTML
    messages = result.messages  # Any messages,

    full_html = (
        '<!DOCTYPE html><html><head><meta charset="utf-8"/></head><body>'
        + html
        + "</body></html>"
    )

    with open("test.html", "w", encoding="utf-8") as f:
        f.write(full_html)

在上面的代码中，我们只是在前面加上必要的开始和结束标记，使html字符串成为有效的HTML源代码

编程相关推荐

未在Tomcat中加载java JAR文件
java创建了一个SpringMVC应用程序，该应用程序在身份验证后将每个请求重定向回以前的URL
Scala未来到Java完全未来
java对象数组重复擦除
Java中的国际化多语言本地化
java在运行Eclipse SWT应用程序后，它显示了许多异常
C++在应用程序运行时返回常量动态JNI数据到java对象
java比较两个未知类型的数组
java为什么以及何时在安卓中注销内容观察员
java如何使用jsoup将正确的字符集设置为proxyserver？

相关问题更多 >

编程相关推荐

热门问题

热门文章

Python使用mammoth将docx转换为html:html，缺少head和body标记

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >