擅长:python、mysql、java
<p>如果您只是要进行HTML清理,可以尝试以下操作:</p>
<p>如果要添加更多转义类型,这可能是最简单的方法:</p>
<pre><code>def escape(htmlstring):
escapes = {'\"': '&quot;',
'\'': '&#39;',
'<': '&lt;',
'>': '&gt;'}
# This is done first to prevent escaping other escapes.
htmlstring = htmlstring.replace('&', '&amp;')
for seq, esc in escapes.iteritems():
htmlstring = htmlstring.replace(seq, esc)
return htmlstring
</code></pre>
<p>这将用正确的HTML转义码替换<code>&</code>、<code>'</code>、<code>"</code>、<code><</code>和{<cd5>}的每个实例。在</p>
<p>有关HTML转义的详细信息:</p>
<p><a href="http://en.wikipedia.org/wiki/HTML#Character_and_entity_references" rel="nofollow">Wikipedia HTML Page</a></p>
<p><a href="http://www.hybridelephant.com/computer/tutorial/spechar.html" rel="nofollow">Every Escape imaginable</a></p>
<p>逃跑快乐!在</p>