如果我读取一个html文件,为什么会出现非类型错误?

2024-09-29 17:23:09 发布

您现在位置:Python中文网/ 问答频道 /正文

我试着读一个html文件,并把相关信息刮下来。 如果我以文本格式打开它,这段代码可以工作,但是如果我以html格式打开它,我会得到下一个错误消息:

"File "C:\Python27\TEST5.py", line 29, in <module>
    for record in tab6col.find_all('tr'):
AttributeError: 'NoneType' object has no attribute 'find_all'"

这两种方法有什么区别?为什么当我尝试以html格式打开它时它不工作?你知道吗

filename=r'output.csv' resultcsv=open(filename,"wb") output=csv.writer(resultcsv, delimiter=';',quotechar = '"', quoting=csv.QUOTE_NONNUMERIC, encoding='latin-1') f = codecs.open('proba.html', 'r') x = f.read() soup = BeautifulSoup(x, 'lxml') tab6col = soup.find('table', { "class" : "tab6col" }) datatable=[] for record in tab6col.find_all('tr'): temp_data = [] for data in record.find_all('td'): temp_data.append(data.text.encode('latin-1')) datatable.append(temp_data) output.writerows(datatable) resultcsv.close()

Tags: csvinforoutputdatahtml格式all

热门问题