Python docxp包_程序模块 - PyPI

一个纯基于python的实用程序，用于从docx文件中提取文本、超链接和图像。

docxp的Python项目详细描述

PyPI

这个项目是由 ankushshah89/python-docx2txt。添加了一个新功能：提取超链接及其对应的文本。

它是一个纯基于python的实用程序，可以从docx文件中提取文本。这个代码取自并改编自 python-docx。它可以不过，也可以从页眉、页脚和超链接中提取text。它现在还可以提取images。

如何安装？

pip install docxpy

怎么跑？

从命令行：

# extract text
docx2txt file.docx
# extract text and images
docx2txt -i /tmp/img_dir file.docx

来自python:

importdocxpyfile='file.docx'# extract texttext=docxpy.process(file)# extract text and write images in /tmp/img_dirtext=docxpy.process(file,"/tmp/img_dir")# if you want the hyperlinksdoc=docxpy.DOCReader(file)doc.process()# process filehyperlinks=doc.data['links']

欢迎加入QQ群-->： 979659372

推荐PyPI第三方库

导航栏
项目描述
版本历史
项目链接
首页
标签
许可证: BSD许可证（BSD 3条款）
作者信息:: 暂无
维护者
yalei
最新PyPI项目
italian_vip_says
UFx
vofs
fake_item_generator
NerEva
django-monologue
fio_product_attribute_strict
climailsystem
pyshape
tbb-devel
npy-append-arra
anthill.tal.macrorenderer
odoo11-addon-stock-a
uuuu
contextil
fyl_nester
appomatic_renderable
teacher
chuletas
slackbot_ce
最新Python常见问题
如何提高Djang的410误差
如何提高doc2vec模型中两个文档（句子）的余弦相似度？
如何提高Docker的日志限制？|[输出已剪裁，达到日志限制100KiB/s]
如何提高DQN的性能？
如何提高EasyOCR的准确性/预测？
如何提高Euler#39项目解决方案的效率？
如何提高F1成绩进行分类
如何提高FaceNet的准确性
如何提高fft处理的精度？
如何提高Fibonacci实现对大n的精度？
如何提高Flask与psycopg2的连接时间
如何提高FosterCauer变换的scipy.signal.invres（）的数值稳定性？
如何提高gae查询的性能？
如何提高GANs用于时间序列预测/异常检测的结果
如何提高gevent和tornado组合的性能？

docxpy 0.8.5

docxp的Python项目详细描述

如何安装？

怎么跑？

推荐PyPI第三方库

iofog

fink-science

sogoqa

org-todo-metrics

my-names2-kardzi

qif2ofx

wmm2020

Flask-Neo4j4

sitefab

env-excavator

daigle-dist

selenium-librar

Taara

state-machine-designer

dbt-sqlite

导航栏

项目链接

标签

维护者

最新PyPI项目

最新Python常见问题

docxpy 0.8.5

docxp的Python项目详细描述

如何安装？

怎么跑？

推荐PyPI第三方库

iofog

fink-science

sogoqa

org-todo-metrics

my-names2-kardzi

qif2ofx

wmm2020

Flask-Neo4j4

sitefab

env-excavator

daigle-dist

selenium-librar

Taara

state-machine-designer

dbt-sqlite

导 航 栏

项目 链接

标 签

维护者

最新PyPI项目

最新Python常见问题

导航栏

项目链接

标签