如何解析di中的表

2024-10-01 15:49:00 发布

您现在位置:Python中文网/ 问答频道 /正文

                                <div id="findet_1" name="findet_1" >

                                    <table width="100%" border="0" cellspacing="0" cellpadding="0">

                                        <tr>

                                            <td class="thc01 w160 gL_10 UC" >&nbsp;Standalone</td>

                                            <td class="thc01 w160 gL_10 tar">Jun'16</td>

                                            <td class="thc01 w160 gL_10 tar">Mar'16</td>

                                            <td class="thc01 w160 gL_10 tar">Dec'15</td>

                                            <td class="thc01 w160 gL_10 tar"><div class="PR20">Sep'15</div></td>

                                        </tr>

                                        <tr>

                                            <td class="thc02 w160 gD_12" >Net Sales</td>

                                            <td class="thc02 w160 gD_12 tar">16,339.70</td>

                                            <td class="thc02 w160 gD_12 tar">15,589.40</td>

                                            <td class="thc02 w160 gD_12 tar">15,065.00</td>

                                            <td class="thc02 w160 gD_12 tar"><span class="PR20">14,824.50</span></td>

                                        </tr>

                                        <tr>

                                            <td class="thc02 w160 gD_12" >Other Income</td>

                                            <td class="thc02 w160 gD_12 tar">50.10</td>

                                            <td class="thc02 w160 gD_12 tar">46.30</td>

                                            <td class="thc02 w160 gD_12 tar">153.30</td>

                                            <td class="thc02 w160 gD_12 tar"><span class="PR20">1,087.40</span></td>

                                        </tr>

                                        <tr>

                                            <td class="thc02 w160 gD_12" >PBDIT</td>

                                            <td class="thc02 w160 gD_12 tar">6,612.30</td>

                                            <td class="thc02 w160 gD_12 tar">5,930.60</td>

                                            <td class="thc02 w160 gD_12 tar">5,543.30</td>

                                            <td class="thc02 w160 gD_12 tar"><span class="PR20">5,416.80</span></td>

                                        </tr>

                                        <tr>

                                            <td class="thc02 w160 gD_12" >Net Profit</td>

                                            <td class="thc02 w160 gD_12 tar">1,427.50</td>

                                            <td class="thc02 w160 gD_12 tar">1,693.90</td>

                                            <td class="thc02 w160 gD_12 tar">1,709.10</td>

                                            <td class="thc02 w160 gD_12 tar"><span class="PR20">2,223.70</span></td>

                                        </tr>

                                    </table>

                                </div>

我正试着看这张表。但无法做到。我在用beautyfulsoup findall先找到div。表在分区内,我找不到那个表。第二个问题是什么是遍历行的最佳方法。在这里的例子中,我希望以csv格式输出,应该用双引号括起来 比如: “独立”、“2016年6月”、“2016年3月”、“2015年12月”、“2015年9月” “净销售额”,“16339.70”,“15589.40”,“15065.00”,“14824.50” “其他收入”,“50.10”,“46.30”,“153.30”,“1087.40” “PBDIT”,“6612.30”,“5930.60”,“5543.30”,“5416.80” “净利润”,“1427.50”,“1693.90”,“1709.10”,“2223.70”

我的代码:

从urllib.请求导入urlopen 从bs4导入BeautifulSoup 进口re

^{pr2}$

我知道我们可以使用get_text获取值,使用for循环遍历行。但我找不到唯一的表:(


Tags: divnettabletartrclasstdspan
2条回答

唯一的区别是find_all()返回包含单个结果的列表,find()只返回结果。在

如果find_all()找不到任何内容,则返回一个空列表。如果find()找不到任何内容,则返回None:

link = bsObj.findAll("div", id="findet_1")
if link:
    table1 = link[0].find('table').find_all('tr')

试试这个:

table_div = html.find('div' , {'id': 'findet_1', 'name': 'findet_1' })
table = table_div.find('table')

或者这个

^{pr2}$

相关问题 更多 >

    热门问题