Python中文
首页
教程
问答
标签
搜索
登录
注册
Python:Scraping table/当第一列不总是等于
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>我试图提取下表的第二列,即肌肉的名称: <a href="http://www.drjastrow.de/WAI/Vokabular/Muskeln-A1.html" rel="nofollow noreferrer">http://www.drjastrow.de/WAI/Vokabular/Muskeln-A1.html</a></p> <p>以下是我目前的代码:</p> <pre><code> import requests import time from bs4 import BeautifulSoup as soup url = "http://www.drjastrow.de/WAI/Vokabular/Muskeln-A1.html" links = [] time.sleep(1) print(url) page = requests.get(url) text = soup(page.text, 'html.parser') table = text.select('table')[1] rows = table.find_all('tr')[2:] names = [] for row in rows: names.append(row.find_all('td')[1].text.replace('\n', '')) print(names) </code></pre> <p>问题是它有时会让我得到行的第二列,有时是第三列,这取决于第一列是否扩展到两行。有道理,但我不知道怎么解决。你知道吗</p> <p>感谢你的建议!你知道吗</p>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>试试这个:</p> <pre><code>import pandas as pd url = 'http://www.drjastrow.de/WAI/Vokabular/Muskeln-A1.html' tables = pd.read_html(url) print(tables[1][1]) </code></pre> <p>输出是标题为“麝香-肌肉(解剖学术语)”的列。你知道吗</p>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
如何在python中从数据帧列中删除分类值?
6 回答
如何在python中从数据帧列表中删除引号
5 回答
如何在python中从数据帧创建列表
3 回答
如何在Python中从数据帧创建嵌套的JSON
4 回答
如何在Python中从数据帧显示wordcloud
9 回答
如何在Python中从数据帧的时间戳中删除字符
1 回答
如何在Python中从数据帧绘制简单绘图?
8 回答
如何在python中从数据帧行提取具有特定长度的范围?
7 回答
如何在python中从数据帧设置dict中的值
1 回答
如何在Python中从数据库中获得一个结果
1 回答
如何在python中从数据框中绘制分类条形图
6 回答
如何在Python中从数据框中选择特定细节?
7 回答
如何在python中从数据集中删除unicode
10 回答
如何在python中从数据集中删除某些数值?
9 回答
如何在python中从数据集中选择行
9 回答
如何在Python中从数组中删除元素
7 回答
如何在python中从数组中删除单个倒逗号?
5 回答
如何在python中从数组中删除对象?
5 回答
如何在python中从数组中删除引号
10 回答
如何在python中从数组中删除所有最小值
8 回答