pythonxml迭代问题和答案

<html> <body> <div> <b>Question 1: What is your name?</b> My name is Peter. </div> <div> <b>Question 2: What is your native language?</b> <div>Esperanto</div> </div> </body> </html>

1条回答

网友

1楼 · 发布于 2024-10-03 21:31:19

迭代顶级div，从b标记中提取问题文本，从下一个同级或下一个同级的下一个同级的文本中提取答案：

from bs4 import BeautifulSoup

soup = BeautifulSoup("""
<html>
 <body>
  <div>
   <b>Question 1: What is your name?</b>
   My name is Peter.
  </div>
  <div>
   <b>Question 2: What is your native language?</b>
   <div>Esperanto</div>
  </div>
 </body>
</html>
""")

for div in soup.find('body').findAll('div', recursive=False):
    question = div.find('b')
    print question.text
    print question.nextSibling.strip() or question.nextSibling.nextSibling.text.strip()

印刷品：

Question 1: What is your name?
My name is Peter.
Question 2: What is your native language?
Esperanto

编程相关推荐

java JNI和取消异步任务
java整数n作为List<String>的第二个参数传递。子列表（fromIndex，toIndex），但是stacktrace说toIndex在Kotlin中是n+2
如何在Java中正确嵌套多个ArrayList/Maps？
在嵌套条件语句中比较数组中的值时，java List没有打印正确的值
从CRON作业运行java代码
JRE使用jvisualvm检测到java致命错误
java将字符添加到BufferedReader中
带有枚举的java单例与带有双重检查锁定的单例
Java中的编译器构造基类的更改会影响子类的字节码吗？
Java作为Windows服务用户数据路径

相关问题更多 >

编程相关推荐

热门问题

热门文章

pythonxml迭代问题和答案

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >