HTML格式如下
<div class="carousel">
<div class="carousel_Wrapper">
<div class="carousel_Container swiper-container">
<ul class="swiper-wrapper">
<li class="swiper-slide">
<figure><img alt="" src="https://s3.amazonaws.com/0001.jpg"/></figure>
</li>
<li class="swiper-slide">
<figure><img alt="" src="https://s3.amazonaws.com/0002.jpg"/></figure>
</li>
<li class="swiper-slide">
<figure><img alt="" src="https://s3.amazonaws.com/0003.jpg"/></figure>
</li>
</ul>
</div>
<div class="carousel_NextBtn"></div>
<div class="carousel_PrevBtn"></div>
</div>
</div>
<div class="carousel">
<div class="carousel_Wrapper">
<div class="carousel_Container swiper-container">
<ul class="swiper-wrapper">
<li class="swiper-slide">
<figure><img alt="" src="https://s3.amazonaws.com/0004.jpg"/></figure>
</li>
<li class="swiper-slide">
<figure><img alt="" src="https://s3.amazonaws.com/0005.jpg"/></figure>
</li>
<li class="swiper-slide">
<figure><img alt="" src="https://s3.amazonaws.com/0006.jpg"/></figure>
</li>
</ul>
</div>
<div class="carousel_NextBtn"></div>
<div class="carousel_PrevBtn"></div>
</div>
</div>
我想用beauthoulsoup改成下面的HTML。在
^{pr2}$我想用下面的方法去掉不必要的东西。
因为可能还有其他的,所以我们指定类并执行deponse(),unwrap()。在
html = # First mentioned html
content = BeautifulSoup(html)
content.find('div', class_='carousel_NextBtn').decompose()
content.find('div', class_='carousel').unwrap()
content.find('div', class_='carousel_Wrapper').unwrap()
content.find('div', class_='carousel_Container swiper-container').unwrap()
当应用上述处理时,我认为将生成如下所示的html。在
<ul class="swiper-wrapper">
<li class="swiper-slide">
<figure><img alt="" src="https://s3.amazonaws.com/0001.jpg"/></figure>
</li>
<li class="swiper-slide">
<figure><img alt="" src="https://s3.amazonaws.com/0002.jpg"/></figure>
</li>
<li class="swiper-slide">
<figure><img alt="" src="https://s3.amazonaws.com/0003.jpg"/></figure>
</li>
</ul>
<div class="carousel_PrevBtn"></div>
<ul class="swiper-wrapper">
<li class="swiper-slide">
<figure><img alt="" src="https://s3.amazonaws.com/0004.jpg"/></figure>
</li>
<li class="swiper-slide">
<figure><img alt="" src="https://s3.amazonaws.com/0005.jpg"/></figure>
</li>
<li class="swiper-slide">
<figure><img alt="" src="https://s3.amazonaws.com/0006.jpg"/></figure>
</li>
</ul>
<div class="carousel_PrevBtn"></div>
我们认为必要的处理如下。在
<ul>
<li>
元素的内容<p><a href="https://xxxx.jp">other photos</a></p>
您的解决方案“检索每个
<ul>
的第一个<li>
元素的内容”可以实现,如上面的代码所示。你在第二张没有遇到任何问题,所以我还没有贴出来。如果你在这方面需要帮助,请告诉我。在相关问题 更多 >
编程相关推荐