擅长:python、mysql、java
<p>不知道哪种方法更快或更好,但下面是一种使用regex的方法:</p>
<pre>
import re
urls = 'albatross.org,boogaloo.boolean.net,bedei9.paralex.zenoparadox.herc.gr,takeawalkon.the.wildside,fuzzy.logic.it,bronzeandiron.age,areyou.serious,mydom.dom.net,hun.com'
regex = re.compile('''[[a-zA-Z0-9\-\.]+\.]*[a-zA-Z0-9\-]{2,4}\.[^\.\,]+''')
url_list = regex.findall(urls)
print(url_list)
</pre>
<p><strong>注意:</strong>我使用重新编译但是如果你只解析一次,那么你就不必了,你可以简单地做关于芬德尔(patern,url)并保留一行代码(当然在导入之后):</p>
^{pr2}$
<p>我还修改了您给出的字符串,以确保它处理了<code>abc.abd.abdcde,bdc...</code>的多次重复。在</p>
<p>如果一些regex专家正在观看,并且您认为您可以做得更好,请发布它,我希望有一个更快/更准确的解决方案:)。在</p>
<p>另外,我想从python专家那里知道在这种情况下哪个方法更快,哪个方法处理更大的字符串更好。在</p>
<p>我应该发问这个问题吗?:)</p>