用python提取特定文本

2024-10-01 17:25:49 发布

您现在位置:Python中文网/ 问答频道 /正文

从下面的文本文件中,如何在python中将所需的字符集从每一行提取到列表中?所需字符为“ONLY REQUIRED1.JPG”、“ONLY REQUIRED2.JPG”、“ONLY REQUIRED3.JPG”。所以结果应该是:

result = ['ONLY REQUIRED1.JPG', 'ONLY REQUIRED2.JPG', 'ONLY REQUIRED3.JPG']


x'<xxx "-//xxx//xxxx//xx">\n<ggg>\n <kkk>\n  <title>asdf asdf/xx/aaa.xxx/bbb.bb.cc</asdf>\n </head>\n <body>\n<pre>\ndhh\n</pre>\n<pre><img src="/icons/blank.gif" alt="Icon "> <a href="?C=N;O=D">Name</a>                                    alt="[DIR]"> <a href="/asdf/kkkk.xxx/">Parent Directory</a>                                                        \n<img src="/lllll/ttt.gif" alt="[IMG]"> \n <a href="ONLY_REQUIRED1.JPG">ertwe</a> \n href="ONLY_REQUIRED2.JPG">x'<xxx "-//xxx//xxxx//xx">\n<ggg>\n <kkk>\n  <title>asdf asdf/xx/aaa.xxx/bbb.bb.cc</asdf>\n </head>\n <body>\n<pre>\ndhh\n</pre>\n<pre><img src="/icons/blank.gif" alt="Icon "> <a href="?C=N;O=D">Name</a> \n href="ONLY_REQUIRED3.JPG">ertwe</a>

Tags: srconlyimgaltgifprexxxjpg
1条回答
网友
1楼 · 发布于 2024-10-01 17:25:49

我会这样做的

import re
my_text = open("some.html").read()
my_list = re.findall("ONLY_REQUIRED\d.JPG",my_text)
print my_list

这使用正则表达式。它正在寻找任何以“ONLY_REQUIRED”开头,后跟一个数字,然后以“.JPG”结尾的任何内容

相关问题 更多 >

    热门问题