java问题解析MHTML
我可以使用this question作为解析“mht”文件的起点,但锚标记(例如:<a href=3D"[my anchor]">[anchor text]></a>
)中的“3D”会断开所有内部链接和嵌入图像。我可以让解析器将“=3D”替换为“=”(例如:<a href="[my anchor]">[anchor text]></a>
),它看起来工作正常,但我想了解“元标记”的用途
为什么从“.docx”导出到“.mht”会在大多数(如果不是全部)html属性的右侧添加“3D”?有没有更好的方法来处理它们,或者在替换它们时使用更好的正则表达式
# 1 楼答案
=3D
是quoted printable encoding的结果。找到一个java库来解码引用的可打印数据应该不会太难