我正在寻找一种方法,用其他字符串替换HTML文件中每行的“href”和“src”内容。所以,我需要替换这个:
<img src="images/file.png" alt="">
有了这个:
<img src="data:image/png;base64,PD94bWwgdmVyc2lvbj0i..." alt="">
实际上,我编写了一个函数,可以将文件转换为base64。我需要搜索href/src,获取他的文件路径内容并将其替换为文件的base64版本,但我不知道如何执行。你知道吗
下面是将文件转换为base64的函数:
def filetoB64 (fpath=None,raw=False):
fstring = None
fmime = None
freturn = None
if fpath is not None:
if os.path.isfile(fpath):
fmime = mimetypes.MimeTypes().guess_type(fpath)[0]
if fmime in (filemimes['text'] + filemimes['image'] + filemimes['audio'] + filemimes['video']):
with open(fpath,'rb') as f:
fcontent = f.read()
fstring = base64.encodestring(fcontent).replace('\n','')
if raw:
freturn = fstring
else:
freturn = ''.join(['data:',fmime,';base64,',fstring])
else:
freturn = fpath
else:
freturn = fpath
return freturn
我假设您将文件转换为
base64
的函数完全可以工作。你知道吗如果要替换HTML代码中的某些标记,可以使用
regex
如下示例:输出:
否则,可以使用^{} ,这是一个Python库,用于从HTML和XML文件中提取数据。你知道吗
相关问题 更多 >
编程相关推荐