用BeautifulSoup解析HTML

2024-10-02 06:29:29 发布

您现在位置:Python中文网/ 问答频道 /正文

我试图迭代一堆html标记,但需要一些指导。如何用漂亮的Soup遍历一堆表行,并输出链接文本?你知道吗

HTML格式:

<div id="thisDiv">
    <table class="thisTable">
        <tr>
            <td><a href="blablabl">BLABLABLA1</a></td><td><a href="blablabla2">BLABLABLA2</a></td>
        </tr>
        <tr>
            <td><a href="blablab3">BLABLABLA3</a></td><td><a href="blablabla4">BLABLABLA4</a></td>
        </tr>
        <tr>
            <td><a href="blablab5">BLABLABLA5</a></td><td><a href="blablabla6">BLABLABLA6</a></td>
        </tr>
    </table>
</div>

Tags: 标记文本divid链接html格式table
1条回答
网友
1楼 · 发布于 2024-10-02 06:29:29

您不必遍历这些行。只需找到表并搜索它包含的所有锚定:

soup = BeautifulSoup(doc)
table = soup.find('table', {'class':'thisTable'}) 
for a in table.findAll('a'):
    print a.text

相关问题 更多 >

    热门问题