将html表格/图表元素转换为imag

2024-06-13 21:40:31 发布

您现在位置:Python中文网/ 问答频道 /正文

这是我在空闲时间试着做的事情。不过,我还不确定我可能面临的复杂性和问题。我想转到这样的网址:https://fred.stlouisfed.org/series/DFII5将此图表另存为图像,在我电脑上的任何地方

我的第一种方法是使用html敏捷包:

 var document = new HtmlWeb().Load("https://fred.stlouisfed.org/series/DFII5");
        var urls = document.DocumentNode.Descendants("img")
                                        .Select(e => e.GetAttributeValue("src", null))
                                        .Where(s => !String.IsNullOrEmpty(s));

甚至可以使用WinForms web浏览器控件:

^{pr2}$

这两种方法都能够从该网页获取所有图像,但是图表是我想要的,它不是图像。在

这个任务可能吗?我需要图书馆/裸体来做这件事吗?我该如何实现这个目标呢?注意:没有必要用C#来完成,它可以是Python或其他任何东西。在

编辑一些进一步的研究引起了我的注意:http://www.princexml.com/和{a3}

据我所知,它们都是html到pdf的库。是否可以使用这些,只获取图表的html并将其转换为pdf格式?在


Tags: 方法httpsorg图像pdfvarhtml图表
2条回答

你可以试试HTML2PDF转换器。见https://www.html2pdf.fr

或HTML2PS转换器。见http://user.it.uu.se/%7Ejan/html2ps.html

ImageMagick可以使用后者,如果安装的话进行转换。请参阅位于http://www.imagemagick.org/script/formats.php的HTML部分

只是第一个想法。是的,那张图不是图像。在

所以,一个想法可以是:让你的软件做一个屏幕截图,然后用一些图像编辑软件开发工具包(SDK)把这个特定区域删掉。在

为了加载一个网站并做一个截图,我会想到一些类似Selenium的东西。对于以后编辑图像,可以使用ImageMagick之类的工具。在

另一个想法是从网站上获取图片的元数据,然后自己画出来。在

相关问题 更多 >