我在使用Tika,我意识到每次下载jar文件并将其放在Temp文件夹中时
Retrieving http://search.maven.org/remotecontent?filepath=org/apache/tika/tika-server/1.19/tika-server-1.19.jar to C:\Users\asus\AppData\Local\Temp\tika-server.jar.
Retrieving http://search.maven.org/remotecontent?filepath=org/apache/tika/tika-server/1.19/tika-server-1.19.jar.md5 to C:\Users\asus\AppData\Local\Temp\tika-server.jar.md5.
问题是jar文件的大小大约是60MB,这需要一些时间来下载。在
这是我使用的代码:
^{pr2}$我找到的唯一解决方法是:
1-使用java -jar tika-server-x.x.jar --port xxxx
手动运行jar
2-使用tika.TikaClientOnly = True
3-将parser.from_file(path)
替换为parser.from_file(path, '/path/to/server')
但我不想手动运行jar文件。如果我可以使用Python自动运行jar文件并在不重新下载的情况下设置tika,那会更好。在
目前没有回答
相关问题 更多 >
编程相关推荐