稀疏矩阵LCP问题的回答

稀疏矩阵LCP

回答此问题可获得 20 贡献值，回答如果被采纳可获得 50 分。

I用大写字母表示矩阵，用小写字母表示向量。 我需要解向量<code>v</code>的以下线性不等式组： <pre class="lang-none prettyprint-override"><code>min(rv - (u + Av), v - s) = 0 </code></pre> 其中<code>0</code>是一个零向量。在 其中<code>r</code>是标量，<code>u</code>和{<cd5>}是向量，<code>A</code>是矩阵。在 定义<code>z = v-s</code>，<code>B=rI - A</code>，<code>q=-u + Bs</code>，我可以将前面的问题重写为<a href="https://en.wikipedia.org/wiki/Linear_complementarity_problem" rel="noreferrer">linear complementarity problem</a>，并希望使用LCP解算器，例如来自<code>openopt</code>： ^{pr2}$ 或者，在矩阵表示法中： <pre class="lang-none prettyprint-override"><code>z'(Bz+q) = 0 z >= 0 Bz + q >= 0 </code></pre> <hr/> 问题是我的方程组太庞大了。要创建<code>A</code>，我 <ul> <li>使用<code>scipy.sparse.diags</code>创建四个矩阵<code>A11</code>，<code>A12</code>，<code>A21</code>，<code>A22</code></li> <li>并将它们组合成<code>A = scipy.sparse.bmat([[A11, A12], [A21, A22]])</code></li> <li>（这也意味着<code>A</code>不是对称的，因此一些有效的<code>QP</code>问题的转换是行不通的）</li> </ul> <code>openopt.LCP</code>显然不能处理稀疏矩阵：当我运行这个程序时，我的计算机崩溃了。通常，<code>A.todense()</code>将导致内存错误。类似地，<code>compecon-python</code>也不能解决稀疏矩阵的<code>LCP</code>问题。在 有什么替代的<code>LCP</code>实现适合这个问题？在 <hr/> 我真的不认为对于一个一般的“解决LCP的工具”问题需要样本数据，但无论如何，我们开始吧 <pre><code>from numpy.random import rand from scipy import sparse n = 3000 r = 0.03 A = sparse.diags([-rand(n)], [0]) s = rand(n,).reshape((-1, 1)) u = rand(n,).reshape((-1, 1)) B = sparse.eye(n)*r - A q = -u + B.dot(s) q.shape Out[37]: (3000, 1) B Out[38]: <3000x3000 sparse matrix of type '<class 'numpy.float64'>' with 3000 stored elements in Compressed Sparse Row format> </code></pre> <hr/> 还有一些建议： <ul> <li><code>openopt.LCP</code>我的矩阵崩溃了，我假设在继续之前它会将矩阵转换为稠密的</li> <li><code>compecon-python</code>完全失败，有一些错误，它显然需要稠密矩阵，并且没有稀疏性的退步</li> <li><code>B</code>不是半正定的，所以我不能把线性互补问题（LCP）重新表述为凸二次问题（QP）</li> <li>来自<a href="https://github.com/stephane-caron/qpsolvers" rel="noreferrer">this exposition</a>的所有QP稀疏解算器都要求问题是凸的，而我的不是</li> <li>在Julia中，<a href="https://github.com/JuliaPy/pyjulia" rel="noreferrer">PATHSolver</a>可以解决我的问题（只要有许可证）。但是，使用<a href="https://github.com/JuliaPy/pyjulia" rel="noreferrer">PyJulia</a>（<a href="https://github.com/JuliaPy/pyjulia/issues/123" rel="noreferrer">my issue report here</a>）从Python调用它时出现问题</li> <li>另外，Matlab有一个LCP解算器，显然可以处理稀疏矩阵，但它的实现更古怪（我真的不想为此放弃Matlab）</li> </ul>

0 条评论
分类：Python问答

默认排序时间排序

1 个回答

匿名 1天前

　擅长：python、mysql、java

这个问题有一个非常有效的（线性时间）解决方案，尽管它需要一些讨论。。。在 Zeroth:澄清问题/LCP 根据评论中的澄清，@FooBar说原始问题是元素方面的<code>min</code>；我们需要找到一个<code>z</code>（或<code>v</code>），这样 <blockquote> either the left argument is zero and the right argument is non-negative or the left argument is non-negative and the right argument is zero </blockquote> 正如@FooBar正确指出的，有效的重新参数化将导致LCP。然而，下面我展示了一个更简单、更有效的解决原始问题的方法（通过利用原始问题中的结构），而不需要LCP。为什么这应该更容易？注意，LCP在<code>z</code>（Bz+q）'z中有一个二次项，但是原始问题没有（只有线性项Bz+q和z）。下面我将利用这个事实。在 首先：简化 有一个重要但关键的细节在很大程度上简化了这个问题： <blockquote> <ul> <li>Create four matrices A11, A12, A21, A22 using scipy.sparse.diags </li> <li>And stack them together as A = scipy.sparse.bmat([[A11, A12], [A21, A22]])</li> </ul> </blockquote> 这有着巨大的影响。具体地说，这不是一个单一的大的问题，而是一个非常小的问题（确切地说是2D）的大数问题。注意，这个<code>A</code>矩阵的块对角结构在所有后续操作中都保持不变。每一个后续的运算都是矩阵向量乘法或内积。这意味着这个程序实际上是在<code>z</code>（或<code>v</code>）变量对中的可分离的。在 具体来说，假设每个块<code>A11,...</code>的大小为<code>n</code>，大小为<code>n</code>。然后批判性地注意到<code>z_1</code>和{<cd12>}只在等式和术语中出现在中，而不会出现在其他地方。因此，该问题可分为<code>n</code>问题，每个问题都是二维的。因此，我将在以后解决2D问题，并且您可以在<code>n</code>上序列化或并行化，而不需要稀疏矩阵或大opt包。在 第二：二维问题的几何结构 假设我们有二维的元素问题，即： <pre><code>find z such that (elementwise) min( Bz + q , z ) = 0, or declare that no such `z` exists. </code></pre> 因为在我们的设置中<code>B</code>现在是2x2，这个问题几何对应于我们可以手动枚举的四个标量不等式（我将它们命名为a1、a2、z1、z2）： ^{pr2}$ 这代表一个（可能是空的）多面体，也就是二维空间中四个半空间的交集。在 第三：解决二维问题 （编辑：为了清楚起见，更新了这一点） 那么2D问题具体是什么呢？我们想要找到一个<code>z</code>，其中一个解决方案（虽然不是完全不同，但并不重要）： <ol> <li>a1&gt；=0，z1=0，a2&gt；=0，z2=0</li> <li>a1=0，z1&gt；=0，a2=0，z2&gt；=0</li> <li>a1&gt；=0，z1=0，a2=0，z2&gt；=0</li> <li>a1=0，z1&gt；=0，a2&gt；=0，z2=0</li> </ol> 如果实现了其中之一，我们就有了一个解：z，其中z和Bz+q的元素最小值是0向量。如果这四个都不能实现，那么这个问题是不可行的，我们将宣布不存在这样的<code>z</code>。在 第一种情况发生在a1，a2的交点正或正中。只需选择解z=B^-1q，并检查它是否是元素非负的。如果是，则返回<code>B^-1q</code>（注意，即使B不是psd，我假设它是可逆的/满秩的）。所以： <pre><code>if B^-1q is elementwise nonnegative, return z = B^-1q. </code></pre> 第二种情况（与第一种情况不完全不同）发生在a1、a2的交点在任何地方但包含原点时。换句话说，当Bz+q&gt；0表示z=0时。当q为元素正时发生这种情况。所以： <pre><code>elif q is elementwise nonnegative, return z = 0. </code></pre> 第三种情况为z1=0，可以代入a2表示当z2=-q2/B22时a2=0。z2必须大于等于0，因此-q2/B22&gt；=0。a1也必须是&gt；=0，用z1和z2代替值，得到-B22/B12*q2+q1&gt；=0。所以： <pre><code>elif -q2/B22 >=0 and -B22/B12*q2 + q1 >=0, return z1= 0, z2 = -q2/B22. </code></pre> 第四步与第三步相同，但是交换1和2。所以： <pre><code>elif -q1/B11 >=0 and -B21/B11*q1 + q2 >=0, return z1 = -q1/B11, z2 =0. </code></pre> 最后第五种情况是当问题不可行时。当上述条件都不满足时会发生这种情况。所以： <pre><code>else return None </code></pre> 最后：将各部分组合起来 求解每一个二维问题都是一对简单/高效/平凡的线性解并进行比较。每个都将返回一对数字或<code>None</code>。然后对所有的<code>n</code>2D问题做同样的处理，并连接向量。如果有没有，这个问题是不可行的（全部没有）。否则，你有你的答案。在

稀疏矩阵LCP

1 个回答

相关Python问题