您有一个标记,其中有些属性值是用引号括起来的,有些是不带引号的。你所说的“加引号回来”是什么意思:要么edit each attribute value把引号删掉(可能是个糟糕的主意),要么在它呈现时加上引号。这取决于您对标记执行的其他处理。下面是打印时添加引号的代码:
input = "<html><sometag attr1=dont_quote_me attr2='but this one is quoted'>Text</sometag></html>"
bs = BeautifulSoup(input)
bs2 = bs.find('sometag')
for a in bs2.attrs:
(attr,aval) = a
print "%s='%s'" % (attr,aval),
给出attr1='dont_quote_me' attr2='but this one is quoted'
您有一个标记,其中有些属性值是用引号括起来的,有些是不带引号的。你所说的“加引号回来”是什么意思:要么edit each attribute value把引号删掉(可能是个糟糕的主意),要么在它呈现时加上引号。这取决于您对标记执行的其他处理。下面是打印时添加引号的代码:
给出
attr1='dont_quote_me' attr2='but this one is quoted'
哪条路由你决定。我假设它们都是单个单词,即match regex
\w+
相关问题 更多 >
编程相关推荐