生成不连续的组合问题的回答

生成不连续的组合

回答此问题可获得 20 贡献值，回答如果被采纳可获得 50 分。

我正在尝试创建一个生成器（iterator，它支持执行next，可能在python中使用yield），它提供来自{1,2，…n}（n和r是参数）的所有r元素的组合，这样在选定的r元素中，没有两个是连续的。 例如，对于r=2和n=4 生成的组合是<code>{1,3}, {1,4}, {2, 4}</code>。 我可以生成所有的组合（作为迭代器）并过滤那些不满足条件的组合，但是我们将做不必要的工作。 是否有某种生成算法使得<code>next</code>为O（1）（如果不可能，则为O（r）或O（n））。 返回集合的顺序与此无关（希望允许O（1）算法）。 注意：我已经将它标记为python，但是一个语言无关的算法也会有帮助。 更新： 我已经找到了一种方法来映射到生成纯组合！一个网络搜索发现O（1）对于组合是可能的（尽管看起来很复杂）。 这是地图。 假设我们有一个<code>x_1, x_2, ... , x_r</code>和{<cd4>}的组合 我们映射到<code>y_1, y_2, ..., y_r</code>，如下所示 <pre><code>y_1 = x_1 y_2 = x_2 - 1 y_3 = x_3 - 2 ... y_r = x_r - (r-1) </code></pre> 这样我们就得到了<code>y_1 < y_2 < y_3 ...</code>而没有非连续约束！ 这基本上相当于从n-r+1中选择r元素。因此，我只需要运行（n-r+1 choose r）的生成。 就我们的目的而言，在生成事物之后使用映射就足够了。 选择svkcr答案的原因 所有的答案都很好，但我选择了svkcr的答案。 以下是一些原因 <ol> <li>它实际上是无状态的（或者更准确地说是“马尔科夫”）。下一个排列可以从上一个排列生成。它在某种程度上几乎是最优的：O（r）空间和时间。</li> <li>这是可以预测的。我们确切地知道组合产生的顺序（字典）。</li> </ol> 这两个属性使得并行生成（在可预测的点上拆分和委托）变得很容易，并引入了容错（如果CPU/机器发生故障，可以从最后生成的组合中选取）！ 抱歉，前面没有提到并行化，因为我在写问题时没有想到，后来才有了这个想法。

0 条评论
分类：Python问答

默认排序时间排序

1 个回答

匿名 1天前

　擅长：python、mysql、java

如果有一种方法可以在O（1）中生成所有组合，那么您可以在O（r）中通过生成和过滤来实现这一点。假设<code>itertools.combinations</code>有一个O（1）<code>next</code>，那么最多可以跳过r-1值，所以最坏的情况是r-1乘以O（1），对吗？在 为了避免混淆，我不认为存在<code>combinations</code>的O（1）实现，因此这是而不是O（r）。但有没有什么可能是的呢？我不确定。不管怎样 所以： <pre><code>def nonconsecutive_combinations(p, r): def good(combo): return not any(combo[i]+1 == combo[i+1] for i in range(len(combo)-1)) return filter(good, itertools.combinations(p, r)) r, n = 2, 4 print(list(nonconsecutive_combinations(range(1, n+1), r)) </code></pre> 打印： ^{pr2}$ <hr/> <code>itertools</code>文档不能保证<code>combinations</code>有一个O（1）<code>next</code>。但在我看来，如果有一个可能的O（1）算法，他们会使用它，如果没有，你就找不到。在 你可以读<a href="http://hg.python.org/cpython/file/3.3/Modules/itertoolsmodule.c#l2289" rel="nofollow">the source code</a>，或者我们可以计时……但是我们要做的是，让我们来计时。在 <a href="http://pastebin.com/ydk1TMbD" rel="nofollow">http://pastebin.com/ydk1TMbD</a>有我的代码、thkang的代码和一个测试驱动程序。它的打印次数是迭代整个序列的成本除以序列的长度。在 当<code>n</code>从4到20，而<code>r</code>固定为2，我们可以看到两者的时间都在下降。（记住，迭代序列的总时间当然在增加。它只是<code>the total length</code>）中的次线性，<code>n</code>范围从7到20，<code>r</code>固定在4，这也是正确的。在 当<code>n</code>固定为12，而<code>r</code>的范围为2到5，两者的时间从2到5线性增加，但是1和6的时间远高于预期。在 仔细想想，924个值中只有6个是好值，对吧？这就是为什么每<code>next</code>的时间会随着<code>n</code>的上升而下降。总的时间在增加，但是产生的价值的数量增长得更快。在 所以，<code>combinations</code>没有O（1）<code>next</code>；它有一些复杂的东西。我的算法没有O（r）<code>next</code>；这也是一个复杂的问题。我认为在整个迭代过程中指定性能保证比按<code>next</code>要容易得多（如果知道如何计算，就很容易除以值的数目）。在 无论如何，我测试的两种算法的性能特征完全相同。（奇怪的是，将包装器<code>return</code>转换为<code>yield from</code>使得递归的更快，过滤的慢……但是无论如何，这是一个小的常量因子，谁在乎呢？）在

生成不连续的组合

1 个回答

相关Python问题