如何使用python替换IMG标记而不使用Beautifulsoup

2024-10-03 06:29:35 发布

您现在位置:Python中文网/ 问答频道 /正文

我有以下HTML:

 <html>
      <head>
           <meta http-equiv="content-type" content="text/html; charset=ISO-8859-1">
      </head>
      <body bgcolor="#FFFFFF" text="#000000">
          hello,<br>
          <br>
          <img src="cid:part1.07060407.05050905@abc.com" alt=""><br>
          <br>
          thankz<br>
      </body>
 </html>

如何使用beautifulsoup替换img标记src属性,而不使用beauthoulsoup?在


Tags: textbrsrchttpimghtmltypebody
1条回答
网友
1楼 · 发布于 2024-10-03 06:29:35

对于您展示的示例,您可能可以使用正则表达式。注意:正确的健壮的方法是使用HTML解析器。在

一般的想法是找到<img src=,然后在"之间找到某个值,然后替换它。。。在

import re
new_html = re.sub('<img src="(.*?)"', '<img src="something else"', old_html)

如果这在不同的HTML上停止工作,那么你就必须想出另一个有效的模式。。。(区分大小写,src可能出现在标记的最后,或者可能有更多/更少的空格,或者没有引号,或者。。。等等……)

相关问题 更多 >