回答此问题可获得 20 贡献值,回答如果被采纳可获得 50 分。
<p>我想用Python将3通道RGB图像转换为索引图像。它用于处理训练深层网络进行语义分割的标签。我的意思是它有一个通道,每个像素都是索引,应该从零开始。当然,它们应该有相同的尺寸。转换基于Python dict中的以下映射:</p>
<pre><code>color2index = {
(255, 255, 255) : 0,
(0, 0, 255) : 1,
(0, 255, 255) : 2,
(0, 255, 0) : 3,
(255, 255, 0) : 4,
(255, 0, 0) : 5
}
</code></pre>
<p>我实现了一个天真的函数:</p>
^{pr2}$
<p>输入<code>im</code>是由<code>cv2.imread()</code>创建的一个<em>numpy</em>数组。但是,这个代码非常慢。
由于<code>im</code>在numpy数组中,我首先用如下方法尝试了<em>numpy</em>的<code>ufunc</code>:</p>
<pre><code>RGB2index = np.frompyfunc(lambda x: color2index(tuple(x)))
indices = RGB2index(im)
</code></pre>
<p>但是结果证明<code>ufunc</code>每次只需要一个元素。我不能给函数一次三个参数(RGB值)。在</p>
<p>那么有没有其他的方法来优化呢?
如果存在更有效的数据结构,映射就不必是那样的。我注意到Python dict的访问不会花费太多时间,但是从<em>numpy array</em>转换到<em>tuple</em>(它是散列的)需要花费很多时间。在</p>
<p>附言:
我的一个想法是在CUDA中实现一个内核。但这会更复杂。在</p>
<p><strong>更新1:</strong>
<a href="https://stackoverflow.com/questions/42750910/convert-rgb-image-to-index-image?noredirect=1#comment72618410_42750910">Dan Mašek's Answer</a>效果不错。但首先我们要把RGB图像转换成灰度。当两种颜色的灰度值相同时,可能会出现问题。在</p>
<p>我把工作代码贴在这里。希望它能帮助别人。在</p>
<pre><code>lut = np.ones(256, dtype=np.uint8) * 255
lut[[255,29,179,150,226,76]] = np.arange(6, dtype=np.uint8)
im_out = cv2.LUT(cv2.cvtColor(im, cv2.COLOR_BGR2GRAY), lut)
</code></pre>