擅长:python、mysql、java
<p>因为内容是由javascript生成的,所以有两个选择:使用类似<code>selenium</code>来模拟浏览器并解析html内容,或者如果可以的话,直接查询API。在</p>
<p>在这种情况下,这个简单的解决方案有效:</p>
<pre><code>import requests
import json
URL = "http://www.wwe.com/api/superstars"
with requests.session() as s:
s.headers = {'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:50.0) Gecko/20100101 Firefox/50.0'}
resp = s.get(URL).json()
for x in resp['talent'][:10]:
print(x['name'])
</code></pre>
<p><strong>输出</strong>(前10条记录):</p>
^{pr2}$