使用BeautifulSoup解析特定数据

<table class="confluenceTable"> <tbody> <tr> <th class="confluenceTh"> Prefix </th> <th class="confluenceTh"> Group </th> <th class="confluenceTh"> Contact </th> <th class="confluenceTh"> Dev/Test Lab </th> <th class="confluenceTh"> Performance </th> </tr> <tr> <td class="confluenceTd"> </td> <td class="confluenceTd"> </td> <td class="confluenceTd"> </td> </tr> <tr> <th class="confluenceTh"> </th> <th class="confluenceTh"> </th> <th class="confluenceTh"> </th> </tr> <tr> <td class="confluenceTd"> SEF00 </td> <td class="confluenceTd"> APTRA Vision </td> <td class="confluenceTd"> </td> <td class="confluenceTd"> <a href="/somepage">VCD Lab</a> , <a href="/somepage">Test Lab</a> </td> <td class="confluenceTd"> <a href="/display">Perf Lab</a> </td> </tr> <tr> <td class="confluenceTd"> SEF01 </td> <td class="confluenceTd"> In-Person Bill Payment </td> <td class="confluenceTd"> Swamy PKV </td>

ii=1 data=requests.get(url,auth=(username,password)) sample=data.content soup=BeautifulSoup(sample,'html.parser') for row in soup.find_all('tr')[1:154]: datatocheck.append(row.get_text(separator='\t')) while(ii<=152): print datatocheck[ii][0:30] ii+=1

2条回答

网友

1楼 · 编辑于 2024-09-28 21:55:33

如果你这样做了呢如果SEF00在ii中：

它可能只打印SEF00

网友

2楼 · 编辑于 2024-09-28 21:55:33

soup = BeautifulSoup(html, 'lxml')

for row in soup.find_all('tr')[3:]:   # remove empty row
    tds = [i.get_text(strip=True) for i in row.find_all('td')]
    print(tds[0],tds[1])

输出：

SEF00 APTRA Vision
SEF01 In-Person Bill Payment

把所有的td都列在一个列表里，然后切分

相关问题更多 >

编程相关推荐

热门问题

热门文章