自动化XML解析并将docx转换为pdf

2024-10-02 04:31:48 发布

您现在位置:Python中文网/ 问答频道 /正文

我已经很多年没有编程了,但是需要让下面的过程自动化

一家政府医疗机构在其网站上发布了一个xml文件。 我需要下载并解析它,然后捕获其中一个包含docx文件url的字段。 然后我需要将它以pdf格式存储在本地文件系统中。 需要每隔n天重复此过程

我以前对PHP非常了解,但是对于这个任务来说,什么是好的呢。python会更好。 因为我没有服务器,所以我想买一个树莓圆周率

你对我如何处理这件事有什么建议

我有一些想法,可以通过cron作业使用wget或curl来获取xml文件。然后使用php、python或bash解析xml文件,使用wget或curl-nad调用docx,然后使用pdf命令行工具。如果是在网站上,我应该将结果加载到sql db中,还是将它们作为目录中的文件列出

如果您有任何想法,我将不胜感激

马丁


Tags: 文件服务器urlpdf网站过程格式编程
1条回答
网友
1楼 · 发布于 2024-10-02 04:31:48

我个人会同意。在raspberry pi上设置节点服务器很容易,node.js有一个库,可以存储任何内容。有很多简单的安装教程,所以有很多像xml parsing in node这样的信息。JavaScript很容易编写代码

例如,如果您需要一个docx转换器,这里有一个:mammoth.js

祝你好运

相关问题 更多 >

    热门问题