如何从python中提取文本

2024-10-01 01:34:21 发布

您现在位置:Python中文网/ 问答频道 /正文

假设我们有文本,其中列存储在表单中:

! Column1<NEWLINE>! Column2<NEWLINE>! Column3<NEWLINE>! Column4<NEWLINE>

示例文本:

 class="wikitable" style="float:right; text-align:center; margin:2em;"<NEWLINE>|+ Comparison of Union and Confederacy, 1860–1864<ref name="census74" /><NEWLINE>! id<NEWLINE>! Year<NEWLINE>! Union<NEWLINE>! Confederacy<NEWLINE>|-<NEWLINE>|rowspan="2"|'''Population'''<NEWLINE>|1860<NEWLINE>| 22,100,000 (71%)<NEWLINE>| 9,100,000 (29%)<NEWLINE>|-<NEWLINE>|1864<NEWLINE>| 28,800,000 (90%)

如何在python中从文本中提取所有列?你知道吗

我试过了

re.findall('NEWLINE>!\s*([^|]+)', text, re.MULTILINE)

https://regex101.com/r/PLKREz/8


Tags: text文本re表单示例stylenewlineclass
2条回答

你可以分开来。你知道吗

split_text = text.split("<NEWLINE>!")

如果你想跳过第一步!此外,您还可以: split_text = text[1:].split("<NEWLINE>!")

你知道吗关于芬德尔('NEWLINE>;!\s*([^<;]+)',文本,关于多行) 也许你可以试试这个。代码从[^ |]到[^<;]略有不同,可以提取四列。你知道吗

相关问题 更多 >