我想在这个网页上搜刮评论。在
http://www.tripadvisor.com/Hotel_Review-g294265-d2309275-Reviews-The_Forest_by_Wangz-Singapore.html
每次审阅中唯一的问题是“More”,它会在OnClick事件上加载更多文本。在
例如:
<span class="taLnk hvrIE6 tr147826763 moreLink" onclick = " ta.util.cookie.setPIDCookie(2247); ta.call('ta.servlet.Reviews.expandReviews', event,this,'review_147826763', '1', 2247)">
More </span>
如何使用LXML/beauthoulsoup废弃完整的评论文本?在
这可能不是您想要的答案,但是我已经开始研究PhantomJS,它为您提供了一个无头、可编写脚本的webkit浏览器。我敢打赌,这是一条比任何ajax逆向工程兔子洞都要容易的路径。。。在
相关问题 更多 >
编程相关推荐