图像噪声与图像纹理匹配

2024-10-03 02:36:53 发布

您现在位置:Python中文网/ 问答频道 /正文

所以我一直在阅读使用TensorFlow和Keras的机器学习,我试着用一些自定义图像设置一个数据集,并尝试学习脚本来识别文本,同时过滤掉噪音,但问题是噪音颜色是一样的,文本颜色会过滤掉所有的内容。在

我并不是要求被调羹,我只是想知道解决/训练脚本解决图像上的文本的最佳方法的指针。在

我想要的是让脚本在屏幕上阅读,计算隐藏在图像中的单词并在命令行中打印结果。在

没有示例代码,因为之前的一切都是失败的,而不是我所寻找的。

Album link for Imgur


Tags: 数据方法图像文本脚本机器内容屏幕
2条回答

在你开始你的项目之前,你应该检查你的数据的“质量”,以及它对实时应用程序或你的项目的价值,如果图像不容易被人类读取,那么用这种数据进行训练就有点错误,因为人类往往很擅长视觉识别事物,很多情况下,“偏差误差”都是根据这一点得出的。
不管怎样,如果你的目标是从图像中读取有噪声的文本,你可以尝试以下这些技巧,这些技巧摘自coursera上的在线课程:“改进深层神经网络:超参数调整、正则化和优化”安德鲁教授天然气:

1-训练你的数据在正常和清晰的文本图像上,因为 它可以让你的算法从清晰的图像中学习很多特征和初始属性,比如字母的形状,有时你可能会对结果感到惊讶。在

2-让你的开发集(以及你的测试集)包含大量嘈杂的文本图像,这样你就可以检查你的算法对你真正关心的数据的处理效果如何(你的目标

3-改变数据集可能有点困难,但如果噪音使foto的一部分变得连人类都难以阅读,那么这个数据集可能就没用了 因此,你可以带来一个噪声清晰的图像,并将它们与噪声图像混合(从旧的数据集中创建一个新的数据集),使其保持真实,而不是太机械化,然后根据新数据训练算法。在

构建一个好的ML算法或应用程序首先取决于您的数据,而这些只是一些符号,可能有助于您以另一种方式思考问题。在

A)您可以尝试获取明文图像的数据,通过在图像中添加人工噪声并将其作为输入来训练GAN或类似的网络进行去噪训练,通过该网络将图像传递给文本检测器/ocr引擎(如Pytheract或google vision ocr)

B)在你可能的字符集(比如YOLO或FasterRCNN)上训练一个图像检测器,你可以通过人为地给数据添加噪声来再次训练图像检测器,但可能需要一些手动注释。在

C)您可以尝试类似this,方法是检查图像中的所有字母表/已知字符,然后组合结果。我个人更喜欢这个。在

另外,我还没有完全阅读C语言中链接的文章,但是你链接的图像似乎更接近于用一次分割法来解决,而不是训练一个GAN。在

在基于PPS关于你的问题,请确保创建一个验证码解决机器人不会违反任何使用该网站的法律条件(我觉得出于某种原因我有义务这么说)

相关问题 更多 >