我怎样才能去掉这个,剩下的用python和beautiful soup,其他的项目需要保留在td
中
<td style="background:#aaccff" width="50"></td>
<td align="left" style="background:#aaccff" width="150">Device Type</td>
<td align="left" style="background:#aaccff" width="115">IP Address</td>
<td align="left" style="background:#aaccff" width="100">Device Name</td>
<td align="left" style="background:#aaccff" width="215">Notes</td>
<td width="50"></td>
这是完整的代码
^{pr2}$以下是我目前所掌握的代码
from ntlm import HTTPNtlmAuthHandler
from bs4 import BeautifulSoup
import requests, os, bleach, urllib2, cookielib
os.system('clear')
user = 'user'
password = "pass"
url = "url"
cookies = cookielib.CookieJar()
passman = urllib2.HTTPPasswordMgrWithDefaultRealm()
passman.add_password(None, url, user, password)
opener = urllib2.build_opener(urllib2.HTTPCookieProcessor(cookies),HTTPNtlmAuthHandler.HTTPNtlmAuthHandler(passman))
pagedata=opener.open(url)
soup=BeautifulSoup(pagedata)
def myfunction(b):
table = b.find('ul', {'class': 'dfwp-column dfwp-list'})
for a in table.findAll('a'):
[a.decompose() for a in table("a")]
for tr in table.findAll('tr'):
for td in tr.findAll('td'):
print td
myfunction(soup)
这是电流输出
设备类型 IP地址 设备名称 注释
音频码网关 172.31.31.2条
FXO公司
设备类型 IP地址 设备名称 注释
IC服务器 172.31.56.151 IND056GIC151 NAT'd IP=PENDING MPLS,语音IP=172.31.52.151
IC服务器 172.31.56.152 索引056GIC152 NAT'd IP=PENDING MPLS,语音IP=172.31.52.152
媒体服务器 IND1106HMS07 IND1106HMS07
媒体服务器 IND1106HMS07 IND1106HMS07
一般来说,当人们问到如何用
bs4
来“删除”某些内容时,他们实际上只是在问如何不将其包含在find
操作中。在您希望排除额外的空格(即带有
tag.text == ''
的标记)和这四个“column header”标记。可以通过CSS选择器执行后者,但前者需要显式过滤。因此,同时做这两件事是最容易的,而且在我看来更具声明性:相关问题 更多 >
编程相关推荐