<p>那么,您想删除所有<code>headers</code>,只获取公司名称的<code>string</code>?
基本上,您可以使用<code>soup.findAll</code>以如下格式查找公司列表:</p>
<blockquote>
<pre><code><strong class="company"><span>중소기업진흥공단</span></strong>
</code></pre>
</blockquote>
<p>然后使用<code>.find</code>函数从<code><span></code>标记中提取信息:</p>
<blockquote>
<pre><code><span>중소기업진흥공단</span>
</code></pre>
</blockquote>
<p>之后,使用<code>.contents</code>函数从<code><span></code>标记获取字符串:</p>
<blockquote>
<p><code>'중소기업진흥공단'</code></p>
</blockquote>
<p>因此,您可以编写一个循环来对每个页面执行相同的操作,并创建一个名为<code>company_list</code>的列表来存储每个页面的结果并将它们附加在一起。你知道吗</p>
<p>代码如下:</p>
<pre><code>from bs4 import BeautifulSoup
import requests
maximum = 12
company_list = [] # List for result storing
for page_number in range(1, maximum+1):
URL = 'http://www.saramin.co.kr/zf_user/jobs/company-labs/list/page/{}'.format(page_number)
response = requests.get(URL)
print(page_number)
whole_source = response.text
soup = BeautifulSoup(whole_source, 'html.parser')
for entry in soup.findAll('strong', attrs={'class': 'company'}): # Finding all company names in the page
company_list.append(entry.find('span').contents[0]) # Extracting name from the result
</code></pre>
<p><code>company_list</code>将为您提供所需的所有公司名称</p>