使用python逐行解析pre-tag

1条回答

网友

1楼 · 发布于 2024-09-27 22:23:39

In [1]: import bs4

In [2]: text = '''<pre>**Date Time DataFeed**
   ...: 10/01/1994 10:00:00 Go_to_sleep
   ...: 10/01/1994 10:00:00 Go_to_sleep
   ...: 10/01/1994 10:00:00 Go_to_sleep
   ...: 10/01/1994 10:00:00 Go_to_sleep</pre>'''

In [3]: soup = bs4.BeautifulSoup(text, 'lxml')

In [4]: soup.pre.get_text()
Out[4]: '**Date Time DataFeed**\n10/01/1994 10:00:00 Go_to_sleep\n10/01/1994 10:00:00 Go_to_sleep\n10/01/1994 10:00:00 Go_to_sleep\n10/01/1994 10:00:00 Go_to_sleep'
In [6]: soup.pre.get_text().splitlines()
Out[6]: 
['**Date Time DataFeed**',
 '10/01/1994 10:00:00 Go_to_sleep',
 '10/01/1994 10:00:00 Go_to_sleep',
 '10/01/1994 10:00:00 Go_to_sleep',
 '10/01/1994 10:00:00 Go_to_sleep']

在bs4中，带有换行符的html代码被转换为\n，可以使用splitlines()将其拆分为list。在

编程相关推荐

java搜索具有外键的JPA实体的约定是什么？
java事务没有使用事务和嵌套方法的2个实例回滚
SpringBootJavaMessageFormat。使用umlauts格式（ä/ö/ü）
java如何通过字符串在sqlite中搜索列
JAVAlang.ClassNotFoundException:org。冬眠Hibernate4的例外情况
java消息正文在Gmail中被弄乱了
java Apache Ignite未使用空值更新缓存
Java正则表达式未捕获组
java onBackPressed（）；除非我叫super否则不行。onBackPressed（）；两次密码
java CustomAlertDialog在删除数据库记录后未完成其进程

相关问题更多 >

编程相关推荐

热门问题

热门文章

使用python逐行解析pre-tag

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >