我试图构建一个只包含表头和与我相关的行的html表。我使用的网站是http://wolk.vlan77.be/~gerben。在
我正在尝试获取表头和表条目,这样就不必每次都查找自己的名称。在
我想做的是:
我现在做的是:
将此数组传递给生成可打印为html页的字符串的方法
def下载URL(self): 全局输入 文件句柄=self.urllib.urlopen('http://wolk.vlan77.be/~gerben') 输入='' 对于线路输入文件句柄.readlines(): 输入+=线路 文件句柄.close()
def soupParserToTable(self,input):
global header
soup = self.BeautifulSoup(input)
header = soup.first('tr')
tableInput='0'
table = soup.findAll('tr')
for line in table:
print line
print '\n \n'
if '''lucas''' in line:
print 'true'
else:
print 'false'
print '\n \n **************** \n \n'
我想从包含lucas的html文件中获取一行,但是当我这样运行时,我在输出中得到以下内容:
^{pr2}$现在我不明白为什么它不匹配,卢卡斯的绳子很明显在里面:/?在
看来你把事情搞得太复杂了。在
这里有一个更简单的版本。。。在
因为线不是字符串,但是美丽组标签实例。尝试获取td值:
相关问题 更多 >
编程相关推荐