Python中文
首页
教程
问答
标签
搜索
登录
注册
在python中使用Beautiful soup分析表
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>所以我有张桌子:</p> <pre><code><table border="1" style="width: 100%"> <caption></caption> <col> <col> <tbody> <tr> <td>Pig</td> <td>House Type</td> </tr> <tr> <td>Pig A</td> <td>Straw</td> </tr> <tr> <td>Pig B</td> <td>Stick</td> </tr> <tr> <td>Pig C</td> <td>Brick</td> </tr> </code></pre> <p>在 在</p> <p>我只是想返回表对的JSON字符串,如下所示:</p> ^{pr2}$ <p>但是,在我的代码中,我似乎无法摆脱HTML标记:</p> <pre><code>stable = soup.find('table') cells = [ ] rows = stable.findAll('tr') for tr in rows[1:4]: # Process the body of the table row = [] td = tr.findAll('td') #td = [el.text for el in soup.tr.finall('td')] row.<a href="https://www.cnpython.com/list/append" class="inner-link">append</a>( td[0]) row.append( td[1]) cells.append( row ) return cells </code></pre> <p>最终,我想这样做: #h=json.dumps文件(单元格) #返回h</p> <p>我的输出是:</p> <p><code>[[<td>Pig A</td>, <td>Straw</td>], [<td>Pig B</td>, <td>Stick</td>], [<td>Pig C</td>, <td>Brick</td>]]</code></p>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>使用<code>text</code>属性仅获取元素的内部文本:</p> <pre><code>row.append(td[0].text) row.append(td[1].text) </code></pre>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
为什么在使用strptime时会出现未进行转换的数据错误?
8 回答
为什么在使用strptim时会出现这个datetime日期错误
6 回答
为什么在使用StyleFrame时索引列的标题不显示sf.至excel()?
6 回答
为什么在使用sum()函数时会发生“int”对象不可调用的错误?
4 回答
为什么在使用sympy.dsolve时会得到“'list'对象没有属性'func'”?
4 回答
为什么在使用tabla时会得到一个空的数据帧?
1 回答
为什么在使用tensorboard时需要add_graph()的第二个参数?
10 回答
为什么在使用TensorFlow Lite转换YOLOv4时,推断时间/大小没有改进?有什么可能的改进吗?
4 回答
为什么在使用Tensorflow加载训练批时会出现内存泄漏?
9 回答
为什么在使用tensorflow时会收到警告/错误(使用函数API,但未实现错误)
9 回答
为什么在使用tetpyclient发出POST请求时出现403错误?
2 回答
为什么在使用TextBlob时会出现HTTP错误?
10 回答
为什么在使用TFIDF时出现错误“IndexError:list index out of range”pyspark.ml.feature?
8 回答
为什么在使用timedelta格式化之后,我在python中的日期是错误的?
3 回答
为什么在使用timeit或exec函数时,函数中的变量不会在提供的全局命名空间中搜索?
3 回答
为什么在使用tkinter时不能使用复选框?
5 回答
为什么在使用todoistpythonapi时会返回这个奇怪的ID?
8 回答
为什么在使用TQM时,在调整图像大小时,处理时间会有很大的差异?
2 回答
为什么在使用Tweepy下载用户时间线时收到错误消息
8 回答
为什么在使用twitter帐户登录Django应用程序时重定向127.0.0.1:8000?
7 回答