字符串匹配/搜索python

2024-10-16 20:50:42 发布

您现在位置:Python中文网/ 问答频道 /正文

我正试图清理维基百科的数据。我有一个包含维度的数据字段,如下所示。你知道吗

["112 x 76 yards (102.4m x 69.4m)", "104.5 x 70.3 m", "107m x 72m", 
 "109×73 yds / 100×67 m", "{{convert|105|x|68|m|yd|1}}", "100 metres by 70 metres"]

提取维度很容易,但考虑到条目有多少变化,提取单位相当困难。 最好的方法是什么?你知道吗

我已经开始使用

"(\d+\.?\d*)"

它应该提取所有的维度,然后我只保存前2个数字匹配,保存一个单位的第一个匹配('m','meter','meters','y','yard','yds','yd','ft',…),然后我可以在以后把所有的都转换成米。你知道吗

我只是不确定如何挽救第一场比赛。你知道吗


Tags: 数据方法convertby单位条目数字meter