如何以特定方式拆分包含数字和字母的文本？

'16.11., ARD, 20.15 Uhr: „Mein Schwiegervater, der Camper“ Vor einigen Jahren hat die ARD-Tochter 17.11., ARD, 20.15 Uhr: „Tatort: Die Pfalz von oben“ Natürlich knüpft der Jubiläums-„Tatort“ mit 18.11., ZDF, 20.15 Uhr: „Stumme Schreie“ „Erschütternd“ ist als Begriff fast noch zu'

['16.11., ARD, 20.15 Uhr: „Mein Schwiegervater, der Camper“ Vor einigen Jahren hat die ARD-Tochter', '17.11., ARD, 20.15 Uhr: „Tatort: Die Pfalz von oben“ Natürlich knüpft der Jubiläums-„Tatort“ mit', '18.11., ZDF, 20.15 Uhr: „Stumme Schreie“ „Erschütternd“ ist als Begriff fast noch zu']

['16.11., ARD, 20.15 Uhr'], ['„Mein Schwiegervater, der Camper“ Vor einigen Jahren hat die ARD-Tochter'], ['17.11., ARD, 20.15 Uhr'] ['Tatort: Die Pfalz von oben“ Natürlich knüpft der Jubiläums-„Tatort“ mit'], ['18.11., ZDF, 20.15 Uhr'], ['„Stumme Schreie“ „Erschütternd“ ist als Begriff fast noch zu']

2条回答

网友

1楼 · 编辑于 2024-06-28 14:31:21

第一个要求：

import pprint
text = """'16.11., ARD, 20.15 Uhr: „Mein Schwiegervater, der Camper“
Vor einigen Jahren hat die ARD-Tochter 

17.11., ARD, 20.15 Uhr: „Tatort: Die Pfalz von oben“
Natürlich knüpft der Jubiläums-„Tatort“ mit

18.11., ZDF, 20.15 Uhr: „Stumme Schreie“
„Erschütternd“ ist als Begriff fast noch zu'"""

pprint.pprint(text.split('\n\n'))

输出：

['16.11., ARD, 20.15 Uhr: „Mein Schwiegervater, der Camper“\n'
 'Vor einigen Jahren hat die ARD-Tochter ',
 '17.11., ARD, 20.15 Uhr: „Tatort: Die Pfalz von oben“\n'
 'Natürlich knüpft der Jubiläums-„Tatort“ mit',
 '18.11., ZDF, 20.15 Uhr: „Stumme Schreie“\n'
 '„Erschütternd“ ist als Begriff fast noch zu']

第二个要求：

lst = text.split('\n\n')
lst2 = [[elem] for elem in sum((i.split(': ',1) for i in lst), [])]
print(lst2)

输出：

[['16.11., ARD, 20.15 Uhr'],
 ['„Mein Schwiegervater, der Camper“\nVor einigen Jahren hat die ARD-Tochter '],
 ['17.11., ARD, 20.15 Uhr'],
 ['„Tatort: Die Pfalz von oben“\nNatürlich knüpft der Jubiläums-„Tatort“ mit'],
 ['18.11., ZDF, 20.15 Uhr'],
 ['„Stumme Schreie“\n„Erschütternd“ ist als Begriff fast noch zu']]

网友

2楼 · 编辑于 2024-06-28 14:31:21

可以将字符串拆分为两行：

s = open('test', 'r').read()
s.split('\n\n')
Out[38]: 
["'16.11., ARD, 20.15 Uhr: „Mein Schwiegervater, der Camper“\nVor einigen Jahren hat die ARD-Tochter",
 '17.11., ARD, 20.15 Uhr: „Tatort: Die Pfalz von oben“\nNatürlich knüpft der Jubiläums-„Tatort“ mit',
 "18.11., ZDF, 20.15 Uhr: „Stumme Schreie“\n„Erschütternd“ ist als Begriff fast noch zu'"]

然后，如果需要，可以在单个新行（“\n”）或冒号（“：”）上拆分更多内容

相关问题更多 >

编程相关推荐

热门问题

热门文章