BeautifulSoup4 findAll仅获得10次引用

2024-09-30 22:11:56 发布

男 | 程序猿一只，喜欢编程写python代码。

我正试图用BeautifulSoup4从网站上搜集一些信息。 html如下所示：

    <ul class=results__list-container">
       <li class="results__list-container-item">
           <div class="classname1"> attribute1 </div>
           <div class="classname2"> attribute2 </div>
       </li>
       <li class="results__list-container-item">
           <div class="classname1"> attribute1 </div>
           <div class="classname2"> attribute2 </div>
       </li>
       <li class="results__list-container-item">
           <div class="classname1"> attribute1 </div>
           <div class="classname2"> attribute2 </div>
       </li>
   </ul>

要使用此代码获取所有列表元素，请执行以下操作：

source = requests.get('https://www.xxxxxxxxxxxx').text
soup = BeautifulSoup(source, 'html.parser')
offers_html = soup.find_all("li", {"class": 'results__list-container-item'}, limit=None)

通过检查浏览器中的html，我可以看到这个类出现了50次。它在前10个实例上运行良好，并使用嵌套的classed打印整个list元素，我能够获得所有需要的属性，但在第10个实例之后，我得到的只是

<li class="results__list-container-item"></li>

有没有办法用所有嵌套类保存所有列表元素

Tags： div 元素列表 container html li item ul

0条回答

目前没有回答

BeautifulSoup4 findAll仅获得10次引用

相关问题更多 >

编程相关推荐

热门问题

热门文章

BeautifulSoup4 findAll仅获得10次引用

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >