使用opencv加载的Torch cyclegan模型没有输出所需的imag

import cv2 import numpy as np model = cv2.dnn.readNetFromTorch('./cyclegan_horse2zebra_cpu.t7') image = cv2.imread('./images/1.jpg') blob = cv2.dnn.blobFromImage(image, 1, (256, 256)) model.setInput(blob) out = model.forward()[0,:,:,:] out = np.reshape(out, (256, 256, 3)) cv2.imshow('image', out) cv2.waitKey(0) cv2.imwrite('out.png', out)

1条回答

网友

1楼 · 发布于 2024-10-01 05:05:25

错过了两件事。第一个是model.forward()[0,:,:,:]返回3x256x2563D blob（平面图像，通道位于第二维度）。但是OpenCV处理交错图像，因此需要按np.transpose：256x256x3排列维度。你知道吗

输出值范围也很重要。对于问题中的图像，我从[-0.832621, 0.891473]得到了值。我们需要将它规范化为Uint8类型的[0, 255]。所有这些都是由cv::normalize制造的。你知道吗

import cv2
import numpy as np

model = cv2.dnn.readNetFromTorch('./horse2zebra_cpu.t7')

image = cv2.imread('./images/1.jpg')

blob = cv2.dnn.blobFromImage(image, 1, (256, 256))
model.setInput(blob)

out = model.forward()[0,:,:,:]
out = cv2.normalize(out, dst=None, alpha=0, beta=255, norm_type=cv2.NORM_MINMAX, dtype=cv2.CV_8U)

out = np.transpose(out, (1, 2, 0))

cv2.imshow('image', out)
cv2.waitKey(0)

cv2.imwrite('out.png', out)

请注意，origin框架可能有不同的后处理过程。如果你能比较一下OpenCV和Torch的输出就好了。这是我从上面的脚本中得到的图像：

相关问题更多 >

编程相关推荐

热门问题

热门文章