java创建一个Word(.doc)文件,将其转换为PDF和HTML,无需打开Office端口
我有一个项目,需要创建一个Word(.doc)文件,其中包含从数据库中获取的特定格式和数据。我想将该文件输出给用户进行编辑,然后将文件上传回服务器。之后,我想对上传的文件执行以下转换
- 。doc to。pdf(可在网上下载和查看)
- 。doc to。html(用于网络上的自由文本搜索)
我想在不打开开放办公端口的情况下实现这一点。早期版本正在这样做,但当用户更多时,打开的端口有崩溃的趋势。所以我想避免这样做。Open Office和OS都重新安装在其他机器上,并以不同的方式进行了尝试,但每次用户增加时,OO端口都会崩溃
有没有其他方法可以实现这种转换?由于碰撞,无法继续进行此操作
这是主机:
- Linux上的Tomcat服务器(RedHat 64位)
- 该应用程序是用Java(JSP和servlet)开发的
- 后端是Oracle
所有用户都有:
- Linux机器,主要是32位Fedora或Suse
感谢您的帮助
# 1 楼答案
您可以使用http://poi.apache.org/来处理实际的。文件。对于PDF,也有许多PDF库可用。问题是很多都不是免费的,但下面是一个开源PDF库列表:http://java-source.net/open-source/pdf-libraries
下面是关于Word到HTML的讨论Convert Word doc to HTML programmatically in Java