Python中文
首页
教程
问答
标签
搜索
登录
注册
使用BeautifulSoup解析特定数据
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>所以我有一个网页,其中有表格数据。以下是该表的HTML代码:</p> <pre><code> <table class="confluenceTable"> <tbody> <tr> <th class="confluenceTh"> <p>Prefix</p> </th> <th class="confluenceTh"> <p>Group</p> </th> <th class="confluenceTh"> <p>Contact</p> </th> <th class="confluenceTh"> <p>Dev/Test Lab</p> </th> <th class="confluenceTh"> <p>Performance</p> </th> </tr> <tr> <td class="confluenceTd"> <p> </p> </td> <td class="confluenceTd"> <p> </p> </td> <td class="confluenceTd"> <p> </p> </td> </tr> <tr> <th class="confluenceTh"> <p> </p> </th> <th class="confluenceTh"> <p> </p> </th> <th class="confluenceTh"> <p> </p> </th> </tr> <tr> <td class="confluenceTd"> <p>SEF00</p> </td> <td class="confluenceTd"> <p>APTRA Vision</p> </td> <td class="confluenceTd"> <p> </p> </td> <td class="confluenceTd"> <p><a href="/somepage">VCD Lab</a> , <a href="/somepage">Test Lab</a></p> </td> <td class="confluenceTd"> <p><a href="/display">Perf Lab</a></p> </td> </tr> <tr> <td class="confluenceTd"> <p>SEF01</p> </td> <td class="confluenceTd"> <p>In-Person Bill Payment</p> </td> <td class="confluenceTd"> <p>Swamy PKV</p> </td> </code></pre> <p>如何格式化Python代码,以便只获取Prefix和Group列下的所有数据。到目前为止,我已经尝试过:</p> <pre><code>ii=1 data=requests.get(url,auth=(username,password)) sample=data.content soup=BeautifulSoup(sample,'html.parser') for row in soup.find_all('tr')[1:154]: datatocheck.append(row.get_text(separator='\t')) while(ii<=152): print datatocheck[ii][0:30] ii+=1 </code></pre> <p>这将提供以下输出:</p> <pre><code>SEF00 APTRA Vision VCD Lab SEF01 In-Person Bill Payment S </code></pre> <p>但是我只想要<code>SEF00</code>(前缀)和<code>APTRA Vision</code>(组),<code>SEF01</code>和<code>In-Person Bill Payment</code>。不是其他列。你知道吗</p> <p>另外,我不能改变我的HTML代码。你知道吗</p>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>如果你这样做了呢 如果SEF00在ii中:</p> <p>它可能只打印SEF00</p>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
无法使用Django/mongoengine连接到MongoDB(身份验证失败)
9 回答
无法使用Django\u mssql\u后端迁移到外部hos
10 回答
无法使用Django&Python3.4连接到MySql
10 回答
无法使用Django+nginx上载媒体文件
10 回答
无法使用Django1.6导入名称模式
2 回答
无法使用Django1.7和mongodb登录管理站点
6 回答
无法使用Djangoadmin创建项目,进程使用了错误的路径,因为我事先安装了错误的Python
3 回答
无法使用Djangockedi验证CBV中的字段
10 回答
无法使用Djangocketditor上载图像(错误400)
7 回答
无法使用Djangocron进行函数调用
4 回答
无法使用Djangofiler djang上载文件
7 回答
无法使用Djangokronos
2 回答
无法使用Djangomssql provid
6 回答
无法使用Djangomssql连接到带有Django 1.11的MS SQL Server 2016
3 回答
无法使用Djangomssq迁移Django数据库
10 回答
无法使用Djangonox创建用户
9 回答
无法使用Djangopyodb从Django查询SQL Server
2 回答
无法使用Djangopython3ldap连接到ldap
2 回答
无法使用Djangoredis连接到redis
6 回答
无法使用Django中的FK创建新表
6 回答