Tensorflow 2:对掩码应用一个热编码以进行语义分割

2024-07-02 04:44:22 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在尝试处理我的地面真相图像,以创建一个热编码张量:

def one_hot(img, nclasses):
  result = np.zeros((img.shape[0], img.shape[1], nclasses))
  img_unique = img.reshape(512*512, img.shape[2])
  unique = np.unique(img_unique, axis=0)
  for i in range(img.shape[0]):
    for j in range(img.shape[1]):
      for k, unique_val in enumerate(unique):
        if (np.array_equal(img[i,j], unique_val)):
          result[i,j,k] = 1
          break

  return result

这是从WxHx3图像创建WxHxN张量。我真的不喜欢这种方法,因为它的性能。你能建议更有效的方法吗

我尝试使用tf.one_hot,但它将图像转换为WxHx3xN张量


Tags: 方法in图像imgfornprangeval
2条回答

对于已知3个类的特定场景,这应该可以更快地工作

def one_hot2(img):
    class1 = [255,0,0]
    class2 = [0,0,255]
    class3 = [255,255,255]  
    label = np.zeros_like(img)
    label[np.sum(img==np.array([[class2]]), 2)==3] = 1
    label[np.sum(img==np.array([[class3]]), 2)==3] = 2
    onehot = np.eye(3)[label]
    return onehot 

对于纯TF2.x方法,还可以执行以下操作

import os
os.environ["TF_CPP_MIN_LOG_LEVEL"] = "3"

import tensorflow as tf

@tf.function # Remove this to see the tf.print array values
def get_one_hot():
  label_ids = [0,5,10]
  mask_orig = tf.constant([[0,10], [0,10]], dtype=tf.float32) # [2,2]
  mask_onehot = tf.concat([tf.expand_dims(tf.math.equal(mask_orig, label_id),axis=-1) for label_id in label_ids], axis=-1) # [2,2,2]
  mask_label_present = tf.reduce_any(mask_onehot, axis=[0,1]) # [2]
  
  tf.print('\n - label_ids:{}'.format(label_ids))
  tf.print('\n - mask_orig:\n{}\n'.format(mask_orig))
  for id_, label_id in enumerate(label_ids):
      tf.print(' - mask_onehot:{}\n{}'.format(label_id, mask_onehot[:,:,id_]))
  tf.print('\n - mask_label_present:\n ', mask_label_present)

get_one_hot()

相关问题 更多 >