擅长:python、mysql、java
<p>在需要使用库搜索标记(我使用BeautifulSoup)之后,您需要使用请求库刮取HTML。
代码与此类似:</p>
<pre><code>import requests
from bs4 import BeautifulSoup
URL = "https://pl.wikisource.org/wiki/Polskie_powiaty_wed%C5%82ug_kodu_TERYT"
page = requests.get(URL)
soup = BeautifulSoup(page.content, "html.parser")
results = soup.find("div", {"id":"mw-content-text"}).find("table",{"border":1}).find_all("td")
namelist = [results[i].text for i in range(0,len(results),2)]
numberlist = [results[i].text.strip('\n') for i in range(1,len(results),2)]
</code></pre>
<p>然后返回字符串类型的值。或者你可以得到所有的值作为一个列表。这是非常简单的转换成熊猫后</p>