生成不连续的组合问题的回答

生成不连续的组合

回答此问题可获得 20 贡献值，回答如果被采纳可获得 50 分。

我正在尝试创建一个生成器（iterator，它支持执行next，可能在python中使用yield），它提供来自{1,2，…n}（n和r是参数）的所有r元素的组合，这样在选定的r元素中，没有两个是连续的。 例如，对于r=2和n=4 生成的组合是<code>{1,3}, {1,4}, {2, 4}</code>。 我可以生成所有的组合（作为迭代器）并过滤那些不满足条件的组合，但是我们将做不必要的工作。 是否有某种生成算法使得<code>next</code>为O（1）（如果不可能，则为O（r）或O（n））。 返回集合的顺序与此无关（希望允许O（1）算法）。 注意：我已经将它标记为python，但是一个语言无关的算法也会有帮助。 更新： 我已经找到了一种方法来映射到生成纯组合！一个网络搜索发现O（1）对于组合是可能的（尽管看起来很复杂）。 这是地图。 假设我们有一个<code>x_1, x_2, ... , x_r</code>和{<cd4>}的组合 我们映射到<code>y_1, y_2, ..., y_r</code>，如下所示 <pre><code>y_1 = x_1 y_2 = x_2 - 1 y_3 = x_3 - 2 ... y_r = x_r - (r-1) </code></pre> 这样我们就得到了<code>y_1 < y_2 < y_3 ...</code>而没有非连续约束！ 这基本上相当于从n-r+1中选择r元素。因此，我只需要运行（n-r+1 choose r）的生成。 就我们的目的而言，在生成事物之后使用映射就足够了。 选择svkcr答案的原因 所有的答案都很好，但我选择了svkcr的答案。 以下是一些原因 <ol> <li>它实际上是无状态的（或者更准确地说是“马尔科夫”）。下一个排列可以从上一个排列生成。它在某种程度上几乎是最优的：O（r）空间和时间。</li> <li>这是可以预测的。我们确切地知道组合产生的顺序（字典）。</li> </ol> 这两个属性使得并行生成（在可预测的点上拆分和委托）变得很容易，并引入了容错（如果CPU/机器发生故障，可以从最后生成的组合中选取）！ 抱歉，前面没有提到并行化，因为我在写问题时没有想到，后来才有了这个想法。

0 条评论
分类：Python问答

默认排序时间排序

1 个回答

匿名 1天前

　擅长：python、mysql、java

这是我的递归生成器（如果选择了<code>n</code>第个项，它将跳过第<code>n+1</code>项）： <pre><code>def non_consecutive_combinator(rnge, r, prev=[]): if r == 0: yield prev else: for i, item in enumerate(rnge): for next_comb in non_consecutive_combinator(rnge[i+2:], r-1, prev+[item]): yield next_comb print list(non_consecutive_combinator([1,2,3,4], 2)) #[[1, 3], [1, 4], [2, 4]] print list(non_consecutive_combinator([1,2,3,4,5], 2)) #[[1, 3], [1, 4], [1, 5], [2, 4], [2, 5], [3, 5]] print list(non_consecutive_combinator(range(1, 10), 3)) #[[1, 3, 5], [1, 3, 6], [1, 3, 7], [1, 3, 8], [1, 3, 9], [1, 4, 6], [1, 4, 7], [1, 4, 8], [1, 4, 9], [1, 5, 7], [1, 5, 8], [1, 5, 9], [1, 6, 8], [1, 6, 9], [1, 7, 9], [2, 4, 6], [2, 4, 7], [2, 4, 8], [2, 4, 9], [2, 5, 7], [2, 5, 8], [2, 5, 9], [2, 6, 8], [2, 6, 9], [2, 7, 9], [3, 5, 7], [3, 5, 8], [3, 5, 9], [3, 6, 8], [3, 6, 9], [3, 7, 9], [4, 6, 8], [4, 6, 9], [4, 7, 9], [5, 7, 9]] </code></pre> 关于效率： 这段代码不能是O（1），因为遍历堆栈并在每次迭代上构建新的集合将不是O（1）。同样，递归生成器意味着您必须使用<code>r</code>最大堆栈深度来获得<code>r</code>项组合。这意味着对于低<code>r</code>，调用堆栈的成本可能比非递归生成更昂贵。有足够的<code>n</code>和{<cd3>}，它可能比基于itertools的解决方案更有效。在 我在这个问题中测试了两个上传的代码： ^{pr2}$ 结果和更多结果（编辑）（在windows7上，python 64位2.7.3，带8gb ram的core i5 ivy bridge）： <pre><code>(n, r) recursive itertools ---------------------------------------- (30, 4) 1.6728046 4.0149797 100 times 17550 combinations (20, 4) 2.6734657 7.0835997 1000 times 2380 combinations (10, 4) 0.1253318 0.3157737 1000 times 35 combinations (4, 2) 0.0091073 0.0120918 1000 times 3 combinations (20, 5) 0.6275073 2.4236898 100 times 4368 combinations (20, 6) 1.0542227 6.1903468 100 times 5005 combinations (20, 7) 1.3339530 12.4065561 100 times 3432 combinations (20, 8) 1.4118724 19.9793801 100 times 1287 combinations (20, 9) 1.4116702 26.1977839 100 times 220 combinations </code></pre> 如您所见，<strike>递归解与itertools.组合当<code>n</code>向上</strike>时，基于的解决方案会变得更宽。在 事实上，由于两个解决方案之间的差距很大程度上依赖于<code>r</code>-更大的<code>r</code>意味着你必须扔掉从<code>itertools.combinations</code>生成的更多组合。例如，在<code>n=20, r=9</code>的情况下：我们在167960（20C9）个组合中过滤并只获取220个组合。如果<code>n</code>和{<cd3>}都很小，那么使用<code>itertools.combinations</code>会更快，因为它在更少的r下效率更高，而且不会像我解释的那样使用堆栈。（如您所见，itertools是非常优化的（如果用<code>for</code>、<code>if</code>、<code>while</code>和一堆生成器和列表理解编写逻辑，它不会像itertools抽象的那样快），这也是人们喜欢python的原因之一——你把代码带到了更高的层次，你就会得到回报。没有多少语言能做到这一点。在

生成不连续的组合

1 个回答

相关Python问题