需要帮助通过这个HTML使用beauthoulsoup和Python进行解析吗

2024-10-01 13:36:33 发布

您现在位置:Python中文网/ 问答频道 /正文

我想用beauthoulsoup解析以下HTML:

<tr class="TrGameOdd">
  <td align="center">
    <a href="Schedule.aspx?WT=0&amp;lg=778&amp;id=,1583114">
      <img border="0" src="/core/engine/App_Themes/Global/images/plus.gif">
    </a>
  </td>
  <td align="left">Oct 20</td>
  <td>777</td>
  <td align="left" colspan="2">Cupcakes</td>
  <td align="right">7+3
    <input type="checkbox" value="0_1583114_-3440" name="text_">
  </td>
  <td align="right">a199
    <input type="checkbox" value="2_1583114_-199.5_-110" name="text_">
  </td>
</tr>

有很多这样的台词,但我只需要一些细节。例如,我想从这一切中解析出777, Cupcakes, 7+3, -3440, a199。我该怎么做呢?我希望它并排打印,我有几行要解析,所以当它打印时应该是这样的:

^{pr2}$

Tags: textnamerightinputvaluetypelefttr
1条回答
网友
1楼 · 发布于 2024-10-01 13:36:33
from BeautifulSoup import BeautifulSoup
soup = BeautifulSoup(html)
trs = soup.find("tr",{"class":"TrGameOdd"})

for tr in trs:
   tds = tr.findAll("td")

   print tds[1].string # Oct 20
   print tds[2].string # 777
   print tds[3].string # Cupcakes
   ...      

你需要继续你自己 http://www.crummy.com/software/BeautifulSoup/bs4/doc/

相关问题 更多 >