背景
当我在工作中运行报告时,在.xlsx文件中有以下内容。你知道吗
A1-名字 B1-姓氏 C1-出席日期
每一行包含参加我们活动的每个人的数据。我正在用python构建一个需要母版.xlsx文件并将其与另一个.xlsx进行比较,并给出以下输出。你知道吗
第二个.xlsx报告每周运行一次,但实际上其中包含一个月的出勤数据。这意味着如果joeblow在一个月内参加了6次,那么joeblow将在.xlsx文件中返回6行,每行都有一个唯一的日期。所以我要迭代数据,比较日期,只保留最近的一个。你知道吗
问题
实际上我已经做了以上的工作,我的第一个爱好是把它变成字典里的字典。其中,姓氏是值为“first”、“date”、“total attended”的键。总参与人数作为for循环的一部分进行计算。你知道吗
但字典里的字典并不会让人觉得像Python。我觉得我在寻找一个更简单的解决方案。尤其是,一旦我开始写输出文件。在dict中访问dict的值感觉不对。你知道吗
关于更好的方法的想法或建议?你知道吗
下面是我昨晚写的代码示例:
data = [This is the data from the .xlsx as a list of lists]
final_data = dict()
dict_errors = 0
for i in data:
if i[1] in final_data:
final_data[i[1]]['total'] = final_data[i[1]]['total'] + 1
if final_data[i[1]]['date'] < i[2]:
final_data[i[1]]['date'] = i[2]
else:
final_data[i[1]] = {
'first': i[0],
'date': i[2],
'total': 1
}
else:
dict_errors += 1
目前没有回答
相关问题 更多 >
编程相关推荐