擅长:python、mysql、java
<p>当调用<code>find_all</code>时,它返回一个标记列表到html的一个子集,如果没有匹配的标记,则返回一个空列表。所以你要搜索的标签在页面中找不到!这可能有很多原因。你可能在你搜索的类中有一个输入错误,或者你搜索的值不是一个类而是一个id或者其他属性。你知道吗</p>
<p>一些页面(通常是较大的网络应用程序,如facebook、instagram、twitter等)会动态创建类、id等,并采取一些小技巧来防止数据被窃取。如果你想看看一个网站会允许你做些什么,你可以查看所谓的<code>robots.txt</code>。你知道吗</p>
<p>例如,如果你想抓取reddit,你可以去<a href="https://reddit.com/robots.txt" rel="nofollow noreferrer">https://reddit.com/robots.txt</a>查看你可以从他们的域中找到的uri列表!网站还将包含一个<code>sitemap</code>,这是一个xml(类似于html)文档,其中包含指向可用页面的链接!你知道吗</p>