用BeautifulSoup解析HTML

2024-10-02 06:29:29 发布

您现在位置：Python中文网/ 问答频道 /正文

8324

网友

男 | 程序猿一只，喜欢编程写python代码。

我试图迭代一堆html标记，但需要一些指导。如何用漂亮的Soup遍历一堆表行，并输出链接文本？你知道吗

HTML格式：

<div id="thisDiv">
    <table class="thisTable">
        <tr>
            <td><a href="blablabl">BLABLABLA1</a></td><td><a href="blablabla2">BLABLABLA2</a></td>
        </tr>
        <tr>
            <td><a href="blablab3">BLABLABLA3</a></td><td><a href="blablabla4">BLABLABLA4</a></td>
        </tr>
        <tr>
            <td><a href="blablab5">BLABLABLA5</a></td><td><a href="blablabla6">BLABLABLA6</a></td>
        </tr>
    </table>
</div>

Tags：标记文本 div id 链接 html 格式 table

1条回答

网友

1楼 · 发布于 2024-10-02 06:29:29

您不必遍历这些行。只需找到表并搜索它包含的所有锚定：

soup = BeautifulSoup(doc)
table = soup.find('table', {'class':'thisTable'}) 
for a in table.findAll('a'):
    print a.text

用BeautifulSoup解析HTML

相关问题更多 >

编程相关推荐

热门问题

热门文章

用BeautifulSoup解析HTML

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >