擅长:python、mysql、java
<p>试图将HTML作为文本来阅读,仅仅是为了将其插入HTML中,并且在编码和解码两个方向上进行斗争,这使得大量的额外工作变得非常困难。</p>
<p>最简单的事情就是不要那样做。你想把test2主体中的所有内容都插入test1主体中的所有内容之后,对吧?所以就这么做吧:</p>
<pre><code>for element in soup_original_2.body:
soup_original_1.body.append(element)
</code></pre>
<p>要先附加分隔符,只需对分隔符执行相同的操作:</p>
<pre><code>b = soup.new_tag('b')
b.append('SEPARATOR')
soup.original_1.body.append(b)
for element in soup_original_2.body:
soup_original_1.body.append(element)
</code></pre>
<p>就这样。</p>
<p>请参阅文档部分<a href="http://www.crummy.com/software/BeautifulSoup/bs4/doc/#modifying-the-tree" rel="noreferrer">Modifying the tree</a>,以获得涵盖所有这些内容的教程。</p>