我试图用BeautifulSoup从这个HTML中提取一些数据。我只想返回data-buyout="1 alchemy" data-ign="DanForeverr" data-league="Standard" data-name="Sulphur Wastes Map" data-seller="NoCocent" data-sellerid="None" data-tab="~price 1 alch" data-x="6" data-y="7"
*`,但没有得到任何结果。我正在使用下面的代码。任何帮助都将不胜感激。在
parsed = soup.find_all('tbody', class=re.compile('^data-'))
^{pr2}$
下面的组合解决了我的问题
您试图在tag类中查找标记属性,但这行不通。在
为什么不按身份证找呢?只需确保它包含0之前的子字符串。在
你不能真的这么做,你可以从标签中提取特定的信息。在
定义您发布的x=html如下:
x = '''<tbody class="item item-live-c324ceb98e25716a0fad0727e0cd64e3" data-buyout="1 alchemy" data-ign="DanForeverr" data-league="Standard" data-name="Sulphur Wastes Map" data-seller="NoCocent" data-sellerid="None" data-tab="~price 1 alch" data-x="6" data-y="7" id="item-container-0">'''
您可以打印这些属性的每个值,但如果您使用},则不会只打印(一个)分支,而且还会打印整个树(子级)
soup.findAll
或{相关问题 更多 >
编程相关推荐