<p>内容是动态加载的,您可以在请求返回的内容中查看模板,或者查看浏览器中的视图源:</p>
<pre><code><div class="pt10 fontlig colr4 clearfix ulinline">
<ul id="profileInfo{profileNoId}" class="fl f14 wid83p descplist">
<li class="textTru">{age}, {height}</li>
<li class="textTru">{edu_level_new}</li>
<li class="textTru">{location}</li>
<li class="textTru">{occupation}</li>
<li class="textTru">{religion}, {caste}</li>
<li class="textTru">{income}</li>
<li class="textTru">{mtongue}</li>
<li class="textTru">{mstatus}</li>
</ul>
</code></pre>
<p>您可以使用<a href="http://selenium-python.readthedocs.io/" rel="nofollow">selenium</a>在浏览器中查看源代码,并将其与<a href="http://phantomjs.org/" rel="nofollow">phantomjs</a>结合以进行无头浏览:</p>
<pre><code>from selenium import webdriver
dr = webdriver.PhantomJS()
dr.get('http://www.jeevansathi.com/search/quick/169903999/1')
ul = dr.find_element_by_id("profileInfo2")
print()
</code></pre>
<p>这将为您提供具有id<em>profileInfo2</em>的ul,如果您希望每个li都在其中,您还可以使用css选择器:</p>
<pre><code>lis = dr.find_elements_by_css_selector("#profileInfo2 li")
</code></pre>
<p>从每一条中提取文本:</p>
<pre><code> [li.text for li in lis])
</code></pre>
<p>你可能想要所有你能得到的uls:</p>
<pre><code>all_uls = dr.find_elements_by_css_selector("ul[id^=profileInfo]")
</code></pre>