刮oncli

2024-10-01 04:58:18 发布

您现在位置:Python中文网/ 问答频道 /正文

我想在这个网页上搜刮评论。在

http://www.tripadvisor.com/Hotel_Review-g294265-d2309275-Reviews-The_Forest_by_Wangz-Singapore.html

每次审阅中唯一的问题是“More”,它会在OnClick事件上加载更多文本。在

例如:

<span class="taLnk hvrIE6 tr147826763 moreLink" onclick = " ta.util.cookie.setPIDCookie(2247); ta.call('ta.servlet.Reviews.expandReviews', event,this,'review_147826763', '1', 2247)">
More </span>

如何使用LXML/beauthoulsoup废弃完整的评论文本?在


Tags: 文本comhttp网页morewww评论hotel
1条回答
网友
1楼 · 发布于 2024-10-01 04:58:18

这可能不是您想要的答案,但是我已经开始研究PhantomJS,它为您提供了一个无头、可编写脚本的webkit浏览器。我敢打赌,这是一条比任何ajax逆向工程兔子洞都要容易的路径。。。在

相关问题 更多 >