"建立HTML表格线至Python"

<tr> <td class="Klasse gerade">12A </td> <td class="Stunde gerade">4 </td> <td class="Fach gerade">GEO statt GE </td> <td class="Lehrer gerade"> </td> <td class="Vertretung gerade">Herr Grieger </td> <td class="Raum gerade">603 </td> <td class="Anmerkung gerade"> </td> </tr> <tr> <td class="Klasse gerade">10A </td> <td class="Stunde gerade">2 </td> <td class="Fach gerade">MA statt GE </td> <td class="Lehrer gerade"> </td> <td class="Vertretung gerade">Herr Grieger </td> <td class="Raum gerade">406 </td> <td class="Anmerkung gerade"> </td> </tr>

1条回答

网友

1楼 · 发布于 2024-10-06 06:50:01

您需要一个类似于Beautifulsoup的HTML解析器。假设所讨论的表是文档中唯一的表或第一个表，则程序可能如下所示：

#!/usr/bin/env python
import urllib
from bs4 import BeautifulSoup


def main():
    link = 'http://www.test.com/vplan.html'
    soup = BeautifulSoup(urllib.urlopen(link), 'lxml')
    table = soup.find('table')
    rows = [x.find_parent('tr') for x in table.find_all(text='10A')]
    for row in rows:
        for cell in row.find_all('td'):
            print cell.text
        print '-' * 10

相关问题更多 >

编程相关推荐

热门问题

热门文章