回答此问题可获得 20 贡献值,回答如果被采纳可获得 50 分。
<p>我有一个输入数据集如下-</p>
<pre><code>INPUT = [
'ABCD , D.O.B: - Jun/14/1999.',
'EFGH , DOB; - Jan/10/1998,',
'IJKL , D-O-B - Jul/15/1985..',
'MNOP , (DOB)* - Dec/21/1999,',
'QRST , *DOB* - Apr/01/2000.',
'UVWX , D O B, - Feb/11/2001 '
]
</code></pre>
<p>我希望这是在以下格式的输出形式-</p>
<pre><code>OUTPUT = [
('ABCD, Jun/14/1999'),
('EFGH, Jan/10/1998'),
('IJKL, Jul/15/1985'),
('MNOP, Dec/21/1999'),
('QRST, Apr/1/2000'),
('UVWX, Feb/11/2001')
]
</code></pre>
<p>我尝试了以下部分有效的代码,但无法按所需的输出格式进行格式化-</p>
<pre><code>import re
INPUT = [
'ABCD , D.O.B: - Jun/14/1999.',
'EFGH , DOB; - Jan/10/1998,',
'IJKL , D-O-B - Jul/15/1985..',
'MNOP , (DOB)* - Dec/21/1999,',
'QRST , *DOB* - Apr/01/2000.',
'UVWX , D O B, - Feb/11/2001 '
]
def formatted_def(input):
for n in input:
t = re.sub('[^a-zA-Z0-9 ]+','',n).split('DOB')
print(t)
formatted_def(INPUT)
</code></pre>
<p>输出-</p>
<pre><code>['ABCD ', ' Jun141999']
['EFGH ', ' Jan101998']
['IJKL ', ' Jul151985']
['MNOP ', ' Dec211999']
['QRST ', ' Apr012000']
['UVWX D O B Feb112001 ']
</code></pre>
<p>任何提示都会很有帮助。提前谢谢!你知道吗</p>