您好,我正在编写一个python脚本来生成web页面的每月和每日访问计数。输入文件:
ArticleName Date Hour Count/Visit
Aa 20130601 10000 1
Aa 20130601 10000 1
Ew 20130601 10000 1
H 20130601 10000 2
H 20130602 10000 1
R 20130601 20000 2
R 20130602 10000 1
Ra 20130601 0 1
Ra 20130601 10000 2
Ra 20130602 10000 1
Ram 20130601 0 2
Ram 20130601 10000 3
Ram 20130602 10000 4
Re 20130601 20000 1
Re 20130602 10000 3
Rz 20130602 10000 1
我需要计算每月和每天的网页浏览量。在
输出:
^{pr2}$我的剧本:
^{3}$我可以得到大部分输出,但我的输出有两种情况是错误的: 1如果ArticleName和ArticleDate相同,则无法获取汇总ArticleName的方法。 对于eg,此脚本给出了Ra行的输出: Ra 20130601 1 1号 Ra 20130601 3 3 Ra 20130602 1 1 所以在最后,Ra应该打印1+3+1=5作为最终的每月总计数,而不是1。在
Ra 20130601 1 1
不应打印。
有人知道怎么纠正吗?
如果你需要更多信息,请告诉我。在
尝试以下操作:
使用^{} ,^{} 。在
输出不同:
^{pr2}$最简单的方法是构建一个以页面名称为键和值的双字典,它是一个从日期到视图数量的字典,迭代列表并构建字典,然后迭代每个页面的字典,并计算每个月的页数。在
更好的方法是使用itertools中的map-reduce函数:http://docs.python.org/2/howto/functional.html
以上代码的Python3版本:
^{pr2}$相关问题 更多 >
编程相关推荐