我正试图清理维基百科的数据。我有一个包含维度的数据字段,如下所示。你知道吗
["112 x 76 yards (102.4m x 69.4m)", "104.5 x 70.3 m", "107m x 72m",
"109×73 yds / 100×67 m", "{{convert|105|x|68|m|yd|1}}", "100 metres by 70 metres"]
提取维度很容易,但考虑到条目有多少变化,提取单位相当困难。 最好的方法是什么?你知道吗
我已经开始使用
"(\d+\.?\d*)"
它应该提取所有的维度,然后我只保存前2个数字匹配,保存一个单位的第一个匹配('m','meter','meters','y','yard','yds','yd','ft',…),然后我可以在以后把所有的都转换成米。你知道吗
我只是不确定如何挽救第一场比赛。你知道吗
目前没有回答
相关问题 更多 >
编程相关推荐