如何解析包含特定单词的行?

2024-09-28 12:10:58 发布

您现在位置:Python中文网/ 问答频道 /正文

我让我的python代码遍历一个HTML文档,虽然这样做了,但我需要它找到一个特定的单词,然后解析包含以下单词的行

例如

如果HTML文档如下所示

htmlDocument = '''
word 023-213103-2402131025901238923213

bla bla bla

bla bla bla 

word 2512-521-096-07464325

bla bla bla 

bla bla bla 

word 123123-0293231
'''

我需要我的愿望清单在解析后看起来像这样

desirableList = [
"word 023-213103-2402131025901238923213",
"word 2512-521-096-07464325",
"word 123123-0293231"
] 

Tags: 代码文档html单词wordblahtmldocumentdesirablelist
1条回答
网友
1楼 · 发布于 2024-09-28 12:10:58

有一种方法:

>>> desirableList  = [s for s in htmlDocument.split("\n") if "word" in s]
>>> desirableList
['word 023-213103-2402131025901238923213', 'word 2512-521-096-07464325', 'word 123123-0293231']

根据需要更新条件,以获得其他类型的结果,如“line start with”:

[s for s in htmlDocument.split("\n") if s.startswith("word")]

相关问题 更多 >

    热门问题