URL替换的pdfredactor语法

2024-09-30 01:36:46 发布

您现在位置:Python中文网/ 问答频道 /正文

使用https://github.com/JoshData/pdf-redactor 如果我提供带有多个URL链接的PDF并使用示例代码:

options.link_filters = [
    lambda href, annotation : "https://www.google.com" 
]

其效果是将PDF中的每个URL都更改为https://www.google.com

我怎样才能让它只替换,例如,用https://www.google.com替换https://www.example.com,而保持其他url不变?你知道吗

非常感谢。你知道吗


Tags: 代码httpsgithubcomurl示例pdf链接
1条回答
网友
1楼 · 发布于 2024-09-30 01:36:46

实际上,你可以在这个库中用lambda做很多事情。在您给我们的这个特定示例中,您在该函数中插入的任何内容都将具有https://www.google.com作为和输出。你知道吗

但是如果你想做一些不同的东西,你可以使用URL(href)或者annotation(或者两者都使用!)作为参数来更改文档中的URL。我将向您介绍一种可以同时更改多个URL的方法:

options.link_filters = [lambda href, annotation: 
'www.google.com' if href == 'www.example.com' else 
'www.anything.com' if href == 'www.whatever.com' else 
'www.nevermind.com' if href  == 'www.bye.com' else href]

在这里,如果您可以替换所有出现的www.example.com对于www.google.comwww.whatever.com对于www.anything.comwww.bye.com对于www.nevermind.com并保留所有其他URL。如果您需要使事情更具动态性,您甚至可以将这些url作为变量传递。你知道吗

如果您想删除所有其他不是这三个URL之一的URL(例如再见.com),您只需在上述代码的末尾用href替换None。你知道吗

嗯,我想我们都同意pdf_redactor的人应该多花点时间在文档上。:)

相关问题 更多 >

    热门问题