擅长:python、mysql、java
<p>作为查看学院详细信息的链接的锚元素有一个<code>id</code>属性,该属性以<code>ContentPlaceHolder1_dlstCollege_</code>开头。因此,将其作为{<cd4>}的{a1}传递:</p>
<pre><code>import re
for anchor in table.findAll('a', attrs={"id": re.compile("^ContentPlaceHolder1_dlstCollege_.*")}):
...
</code></pre>
<p>您也可以将其作为<a href="https://www.crummy.com/software/BeautifulSoup/bs4/doc/#the-keyword-arguments" rel="nofollow noreferrer">^{<cd1>} keyword argument</a>传递给<code>find_all()</code>:</p>
<pre><code>for anchor in table.findAll('a', id=re.compile("^ContentPlaceHolder1_dlstCollege_.*")):
...
</code></pre>
<p>正则表达式可以变得更加具体,比如<code>"^ContentPlaceHolder1_dlstCollege_hlpkInstituteName_.*"</code>,它应该只匹配学院名称提供的链接</p>
<p>(我会删除你放在末尾的<code>[1:]</code>,因为这可能会在开始时过滤掉你不想要的链接。如果不需要,那么就把它重新添加进去。)</p>