用beautifulsoup从html中的标记中提取文本 - 问答

... <div class="txt"> Power: On Source: DVI Lamp runtime: 396 hours Lamp remaining: 2035 hours Total operation: 2551 hours </div> ...

2条回答

网友

1楼 · 编辑于 2024-06-01 07:19:17

试试看

data=[b.string for b in main_div.findAll('b')]

网友

2楼 · 编辑于 2024-06-01 07:19:17

也许是这样的？

import BeautifulSoup

html = '''<div class="txt"><br> 
\nPower: <b>On</b><br><br>
\nSource: <b>DVI</b><br><br>
\nLamp runtime: <b>396</b> hours<br>
\nLamp remaining: <b>2035</b> hours<br>
\nTotal operation: <b>2551</b> hours<br>
\n</div>'''

soup = BeautifulSoup.BeautifulSoup(html)
bTags = [] 

for i in soup.findAll('b'):
    bTags.append(i.text)

bTags的内容：

[u'On', u'DVI', u'396', u'2035', u'2551']

编程相关推荐

字典java cassandra对象映射注释
java定制Solr TokenFilter lemmatizer
字符串从Java文件中读取windows文件名
java如何在Windows上设置StanfordCorenlp服务器以返回文本
java axis2“意外的子元素值”
java使用POI HSSF获取错误
多线程Java等待计时器线程完成
java ForkJoinPool BuffereImage处理风格
从java代码运行Python脚本
java将字节[]转换为短[]，使每个短元素包含13位数据

用beautifulsoup从html中的<b>标记中提取文本

相关问题更多 >

编程相关推荐

热门问题

热门文章

用beautifulsoup从html中的<b>标记中提取文本

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >