擅长:python、mysql、java
<p>在python中,Mechanize和Beautiful soup是不可击败的web清除工具。在</p>
<p>但你需要明白什么是什么意思:</p>
<p><code>Mechanize</code>:它模仿网页上的浏览器功能。在</p>
<p><code>BeautifulSoup</code>:HTML解析器,即使在HTML格式不好的情况下也能正常工作。在</p>
<p>你的问题似乎是<code>javascript</code>。价格是通过使用<code>javascript</code>的ajax调用填充的。^然而,{<cd1>}不执行javascript,因此javascript产生的任何内容对于mechanize都是不可见的。在</p>
<p>看看这个:<a href="http://github.com/davisp/python-spidermonkey/tree/master" rel="nofollow">http://github.com/davisp/python-spidermonkey/tree/master</a></p>
<p>这是一个使用js执行的mechanize和Beautiful soup的包装器。在</p>