擅长:python、mysql、java
<p>使用<a href="http://www.crummy.com/software/BeautifulSoup/" rel="nofollow">Beautiful</a>soup,它允许您迭代标记,即使它们是自定义的。做这种手术很实用</p>
<pre><code>from BeautifulSoup import BeautifulSoup
tags = "<list><list-item>First level<list><list-item>Second level</list-item></list></list-item></list>"
soup = BeautifulSoup(tags)
print [[ item.text for item in list_tag('list-item')] for list_tag in soup('list')]
Output : [[u'First level'], [u'Second level']]
</code></pre>
<p>我使用了嵌套列表理解,但您可以使用嵌套for循环</p>
^{pr2}$
<p>我希望这对你有帮助。在</p>
<p>在我的示例中,我使用了beautifulsoup3,但该示例应该与BeautifulSoup4一起工作,但仅限于导入更改。在</p>
<pre><code>from bs4 import BeautifulSoup
</code></pre>