当父标记的子级具有某些属性值时，如何使用BeautifulSoup获取父标记的名称值？

1条回答

网友
1楼 · 发布于 2024-09-28 22:32:28

您的代码找不到任何内容，如果您打印AttrYES，它将是[]。问题是，当您将bs4与解析器lxml一起使用时，所有标记和属性名都将转换为小写，请参考official doc。如果你打印汤，它会给你：
<html><body><tag inline="no" name="Thumbnail" nonsearchable="yes"> <attribute> <attribute name="AText" searchable="yes"></attribute> </attribute> </tag> <tag inline="no" name="Label" nonsearchable="yes"> <attribute> <attribute name="AText" searchable="no"></attribute> </attribute> </tag> <tag inline="no" name="Image" nonsearchable="yes"> <attribute> <attribute name="BText" searchable="yes"> </attribute> </attribute></tag> <tag inline="no" name="Wonder" nonsearchable="yes"> <attribute> <attribute name="BText" searchable="yes"></attribute> </attribute> </tag></body></html>
因此，您可以这样修改代码：
^{pr2}$
打印内容为：
^{3}$
然后您可以将它们写入excel文件：
import xlsxwriter workbook = xlsxwriter.Workbook('result.xlsx') worksheet = workbook.add_worksheet() # Write header worksheet.write(0, 0, result.keys()[0]) worksheet.write(0, 1, result.keys()[1]) # Write data. worksheet.write_column(1, 0, result.values()[0]) worksheet.write_column(1, 1, result.values()[1]) workbook.close()
result.xlsx将是：
更新：使用openpyxl
from openpyxl import Workbook wb = Workbook() # grab the active worksheet ws = wb.active # Data can be assigned directly to cells i,j = 1,1 for keys,values in a.items(): ws.cell(column=i, row=1, value=keys) for row in range(len(values)): ws.cell(column=i, row=j+1, value=values[row]) j+=1 j=1 i+=1 wb.save("result.xlsx")

相关问题更多 >

编程相关推荐

热门问题

热门文章