我有一个由180列和200000行组成的庞大数据库。为了更好地说明,我有一个180×200000的矩阵。每个矩阵都是一个位数。我要找出他们的共现数。
例如,我有一个5列的数据,值为1、2、3、4、5。我需要找出数据库中(1,2),(1,3),(1,4),(1,5),(2,3),(2,4),(2,5),(3,4),(3,5),(4,5)发生的次数。你能给我一个解决这个问题的办法吗?
我接触过R和python。所以任何使用这些的建议都会很有帮助。
这也可以用AWS地图减速器来完成吗?这些行上的任何帮助或指示也会很有帮助。在
Tags:
对数只是单粒子数的乘积。在
使用R:
生成一个包含200000行和180列的矩阵,其元素为数字:
现在每行的表位数:
现在找出每一行的对数:
合计行数:
验证第一行的结果:
相关问题 更多 >
编程相关推荐