In [22]: str = '<span class="addressRegion">\n\t\t\t\t\t\t\t\t\tMA\n\t\t\t\t\t\t\t\t</span>'
In [23]: from bs4 import BeautifulSoup
In [24]: soup = BeautifulSoup(str, 'html.parser')
In [25]: soup.text
Out[25]: u'\n\t\t\t\t\t\t\t\t\tMA\n\t\t\t\t\t\t\t\t'
In [26]: soup.text.strip()
Out[26]: u'MA'
更新 如果你真的想使用regex,你可以这样做,但是我认为@cricket\u007的解决方案是更好的方法。你知道吗
你所需要做的就是用另一个反斜杠来避开反斜杠。你也可以去掉重复的'\t':
Regex实际上是不必要的
相关问题 更多 >
编程相关推荐