有 Java 编程相关的问题?

你可以在下面搜索框中键入要查询的问题!

java问题解析MHTML

我可以使用this question作为解析“mht”文件的起点,但锚标记(例如:<a href=3D"[my anchor]">[anchor text]></a>)中的“3D”会断开所有内部链接和嵌入图像。我可以让解析器将“=3D”替换为“=”(例如:<a href="[my anchor]">[anchor text]></a>),它看起来工作正常,但我想了解“元标记”的用途

为什么从“.docx”导出到“.mht”会在大多数(如果不是全部)html属性的右侧添加“3D”?有没有更好的方法来处理它们,或者在替换它们时使用更好的正则表达式


共 (1) 个答案

  1. # 1 楼答案

    =3Dquoted printable encoding的结果。找到一个java库来解码引用的可打印数据应该不会太难