import requests
from bs4 import BeautifulSoup
URL = "https://pl.wikisource.org/wiki/Polskie_powiaty_wed%C5%82ug_kodu_TERYT"
page = requests.get(URL)
soup = BeautifulSoup(page.content, "html.parser")
results = soup.find("div", {"id":"mw-content-text"}).find("table",{"border":1}).find_all("td")
namelist = [results[i].text for i in range(0,len(results),2)]
numberlist = [results[i].text.strip('\n') for i in range(1,len(results),2)]
类型1:
只需使用
pandas
方法pd.read_html
方法,并从中提取所需的df
类型2:
您可以同时使用
request
和bs4
模块来查找表并将数据解析到pandas
方法输出:
在需要使用库搜索标记(我使用BeautifulSoup)之后,您需要使用请求库刮取HTML。 代码与此类似:
然后返回字符串类型的值。或者你可以得到所有的值作为一个列表。这是非常简单的转换成熊猫后
相关问题 更多 >
编程相关推荐