不能将名字和日期从字典中分离出来，以便将它们写入excel文件

import re import requests from bs4 import BeautifulSoup from openpyxl import load_workbook wb = load_workbook('container.xlsx') ws = wb['Sheet1'] url = "https://abr.business.gov.au/ABN/View?id=78007306283" response = requests.get(url) soup = BeautifulSoup(response.text,'lxml') try: names_n_dates = {item.find("a").get_text(strip=True):' '.join(item.find("a").find_parent().find_next_sibling().text.split()) for item in soup.find("th",text=re.compile("Business name",re.I)).find_parent().find_next_siblings("tr")} except AttributeError: names_n_dates = "" items = {k:v for k,v in names_n_dates.items()} print(items) ws.append([items.split()]) wb.save("container.xlsx")

2条回答

网友

1楼 · 编辑于 2024-09-21 05:27:28

要解决这个问题，您可以迭代（key，value）元组的字典项，然后像列表一样获得这些项中每个项的key和value。键位于项的位置0，值位于位置1

import re
import requests
from bs4 import BeautifulSoup
from openpyxl import load_workbook

wb = load_workbook('container.xlsx')
ws = wb['Sheet1']

url = "https://abr.business.gov.au/ABN/View?id=78007306283"

response = requests.get(url)
soup = BeautifulSoup(response.text,'lxml')
try:
    names_n_dates = {item.find("a").get_text(strip=True):' '.join(item.find("a").find_parent().find_next_sibling().text.split()) for item in soup.find("th",text=re.compile("Business name",re.I)).find_parent().find_next_siblings("tr")}
except AttributeError: names_n_dates = ""

row = []

for item in dict.items(): #iterate over all dict items
   row.append(item[0]) #key
   row.append(item[1]) #value

ws.append(row)

wb.save("container.xlsx")

网友

2楼 · 编辑于 2024-09-21 05:27:28

如果您想保持ws.append()如您所愿（将一个列表追加为一行），请执行以下操作：

import re
import requests
from bs4 import BeautifulSoup
from openpyxl import load_workbook

wb = load_workbook('container.xlsx')
ws = wb['Sheet1']

url = "https://abr.business.gov.au/ABN/View?id=78007306283"

response = requests.get(url)
soup = BeautifulSoup(response.text,'lxml')
try:
    names_n_dates = {item.find("a").get_text(strip=True):' '.join(item.find("a").find_parent().find_next_sibling().text.split()) for item in soup.find("th",text=re.compile("Business name",re.I)).find_parent().find_next_siblings("tr")}
except AttributeError: names_n_dates = ""

row = []

for item in names_n_dates.items():
   for column in item:
       row.append(column)

ws.append(row)

wb.save("container.xlsx")

相关问题更多 >

编程相关推荐

热门问题

热门文章