如何使用openpyxl在Python中将一个excel文件的列值与另一个excel文件的列值进行比较?

2024-09-28 13:07:07 发布

您现在位置:Python中文网/ 问答频道 /正文

我能够读取两个excel文件的列数据。以下是我的密码:-

from openpyxl import load_workbook

book = load_workbook("Book1.xlsx")
book2 = load_workbook("Book2.xlsx")

sheets = book['Sheet1']
anotherSheet = book2["sheet1"]

for val1 in sheets:
    print(val1[0].value)

print("\n\n\n\n")

for val2 in anotherSheet:
    print(val2[0].value)

我需要将Book1列的每个值与Book2列的每个值进行比较。我完全不知道如何进行比较。如果值匹配,那么我可以添加另一列并输入“是”,如果不匹配,那么我可以输入“否”。换句话说,我只需要检查Book1列的值是否存在于Book2中。我们将非常感谢您的帮助


Tags: inforvalueloadxlsxworkbookprintsheets
1条回答
网友
1楼 · 发布于 2024-09-28 13:07:07

最后,我想出了解决办法

首先,我们需要创建3个列表来存储book1、book2和tempList中的值,以存储匹配的值

from openpyxl import load_workbook

book = load_workbook("Book1.xlsx")
book2 = load_workbook("Book2.xlsx")

sheets = book['Sheet1']
anotherSheet = book2["sheet1"]
book1_list = []
book2_list = []
tempList = []

接下来,我们还希望跳过列的标题并存储在新变量中

skip_Head_of_anotherSheet = anotherSheet[2: anotherSheet.max_row]

然后遍历工作表,并将所需列的值附加到它们各自的列表中(在我的示例中是“0”,表示第一列)

for val1 in sheets:
    book1_list.append(val1[0].value)

for val2 in skip_Head_of_anotherSheet:
    book2_list.append(val2[0].value)

检查列表中是否有重复,并删除任何重复的值

book1_list = list(dict.fromkeys(book1_list))

存储列表的长度以进行调试

length_of_firstList = len(book1_list)
length_of_secondList = len(book2_list)

接下来,遍历这两个列表并检查它们是否匹配,然后将匹配的值存储到tempList

for i in book1_list:
    for j in book2_list:
        if i == j:
           tempList.append(j)
           #print(j)

现在,是时候编辑我们的excel表格了。我们将遍历存储在tempList中的匹配值,并查找实际excel工作表中的值。当我们检测到相同的值时,我们将通过标识该特定行的索引,将YES标记到excel工作表的第4列,即“D”列。此外,如果“D”列上的单元格为空,则我们将标记NO

for temp in tempList:
    for pointValue in skip_Head_of_anotherSheet:
        if temp == pointValue[0].value:
            anotherSheet.cell(column=4, row=pointValue[0].row, value="YES")
            #print(pointValue[0].row)

        if pointValue[3].value is None:
            anotherSheet.cell(column=4, row=pointValue[0].row, value="NO")

最后,我们将向新填充的列&;保存excel工作表并打印所需信息,以便调试

anotherSheet.cell(column=4, row=1, value="PII")
book2.save("Book2.xlsx")

print("SUCCESSFULLY UPDATED THE EXCEL SHEET")
print("Length of First List = ", length_of_firstList)
print("Length of Second List = ", length_of_secondList)

我希望这将帮助有同样问题的人

相关问题 更多 >

    热门问题