Python如何与现有的jar文件一起使用tika,而无需重新下载

2024-10-06 14:00:20 发布

您现在位置:Python中文网/ 问答频道 /正文

我在使用Tika,我意识到每次下载jar文件并将其放在Temp文件夹中时

Retrieving http://search.maven.org/remotecontent?filepath=org/apache/tika/tika-server/1.19/tika-server-1.19.jar to C:\Users\asus\AppData\Local\Temp\tika-server.jar.
Retrieving http://search.maven.org/remotecontent?filepath=org/apache/tika/tika-server/1.19/tika-server-1.19.jar.md5 to C:\Users\asus\AppData\Local\Temp\tika-server.jar.md5.

问题是jar文件的大小大约是60MB,这需要一些时间来下载。在

这是我使用的代码:

^{pr2}$

我找到的唯一解决方法是:

1-使用java -jar tika-server-x.x.jar --port xxxx手动运行jar

2-使用tika.TikaClientOnly = True

3-将parser.from_file(path)替换为parser.from_file(path, '/path/to/server')

但我不想手动运行jar文件。如果我可以使用Python自动运行jar文件并在不重新下载的情况下设置tika,那会更好。在


Tags: 文件topathorghttpsearchserverapache