擅长:python、mysql、java
<p>我没有尝试过这样的事情,但是我的猜测是如果你想直接从“页面源代码”获得它,你需要像selenium这样的东西来实际导航页面,因为页面是动态的。在</p>
<p>或者,如果您只对评论感兴趣,您可以使用英国每日邮报的api获取评论。在</p>
<p>注意查询字符串“max=1000”“&order”等中的项目。如果API对最大“max”值有限制,则可能还需要使用变量“offset”沿side max查找所有注释。在</p>
<p>我不知道API是在哪里定义的,你可以通过查看你的浏览器在搜索网页时发出的网络请求来查看它。在</p>
<p>您可以从<a href="http://www.dailymail.co.uk/reader-comments/p/asset/readcomments/5100519?max=1000&order=desc&rcCache=shout" rel="nofollow noreferrer">http://www.dailymail.co.uk/reader-comments/p/asset/readcomments/5100519?max=1000&order=desc&rcCache=shout</a>获取该页面的JSON格式的注释数据。似乎每篇文章的url中都有类似“5101863”的内容,您可以使用swap这些数字来表示您想要评论的每个新故事。在</p>