使用现有密钥Pysp创建值列表的组合

网友

1楼 · 编辑于 2024-10-06 11:30:50

我认为以色列的回答是不完整的，所以我更进一步。在

import itertools

a = sc.parallelize([
    (1, [1,2,3,4]),
    (2, [3,4,5,6]),
    (3, [-1,2,3,4])
  ])

def combinations(row):
  l = row[1]
  k = row[0]
  return [(k, v) for v in itertools.combinations(l, 2)]

a.map(combinations).flatMap(lambda x: x).take(3)
# [(1, (1, 2)), (1, (1, 3)), (1, (1, 4))]

网友

2楼 · 编辑于 2024-10-06 11:30:50

使用itertools创建组合。下面是一个演示：

import itertools

k, v1, v2, v3 = 'k1 v1 v2 v3'.split()

a = (k, [v1,v2,v3])

b = itertools.combinations(a[1], 2)
data = [(k, pair) for pair in b]

data将是：

^{pr2}$

网友

3楼 · 编辑于 2024-10-06 11:30:50

我已经做了这个算法，但是如果数值比较大的话，它会运行在一个大数据集群中（cloudera），所以我想我必须把这个函数放到pyspark中，如果可以的话，请帮帮我。在

将熊猫作为pd导入将itertools作为itts导入

号码列表=[10953，10423，10053]

def减压器（nums）： def范围（n）：打印（n）返回范围（n，-1，-1）

num_list=列表（map（范围，num））退货清单(itts.产品（*数字列表）

数据=pd数据帧（减速器（编号清单）打印（数据）

相关问题更多 >

编程相关推荐

热门问题

热门文章

使用现有密钥Pysp创建值列表的组合

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >