用d中的Django运行tika python

2024-09-30 02:20:01 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个django站点,它使用tikapython解析pdf,并将解析的pdf内容存储在elasticsearch索引中。它在我的本地机器上工作得很好。我想用docker运行这个安装程序。但是,tikapython不能工作,因为它需要java8在后台运行REST服务器。你知道吗

我的dockerfile:

FROM python:3.6.5

WORKDIR /site
COPY requirements.txt ./
RUN pip install -r requirements.txt
COPY . .
EXPOSE 8000
EXPOSE 9200
ENV PATH="/site/poppler/bin:${PATH}"
CMD ["python", "manage.py", "runserver", "0.0.0.0:8000"]

你知道吗要求.txt文件:

django==2.2
beautifulsoup4==4.6.0
json5==0.8.4
jsonschema==2.6.0
django-elasticsearch-dsl==0.5.1
tika==1.19
sklearn

where(dockerfile或requirements)以及如何添加tika所需的java8以使其在docker中工作。在线教程/示例包含容器中的java+tika,很容易实现。不幸的是,在stackoverflow中也找不到类似的解决方案。你知道吗


Tags: pathdjangodockerdockerfiletxtpdf站点site

热门问题