我有一个文本文件包含大量的网址,但他们有时间戳在最后,这对我来说有点多余。在
http://techcrunch.com/2012/02/10/vevo-ceo-tries-to-explain-their-hypocritical-act-of-piracy-at-sundance/)16:55:40
http://techcrunch.com/2012/04/30/edmodo-hits-7m/)15:18:45
我想在python中使用正则表达式可以帮助我摆脱它,但同时我可以使用Python split and replace
操作,它可以删除末尾的时间戳,其输出与下面给定的url类似
现在我的问题是,正则表达式样式或python字符串方法在空间和时间方面的性能会更好,还是有其他更好的方法。在
另一种可能性是:
这应该比遍历每一行都快:
我不会用正则表达式来完成这样的任务,这太容易了
或者如果
^{pr2}$url
包含)
:相关问题 更多 >
编程相关推荐