擅长:python、mysql、java
<p>在你开始你的项目之前,你应该检查你的数据的“质量”,以及它对实时应用程序或你的项目的价值,如果图像不容易被人类读取,那么用这种数据进行训练就有点错误,因为人类往往很擅长视觉识别事物,很多情况下,“偏差误差”都是根据这一点得出的。<br/>
不管怎样,如果你的目标是从图像中读取有噪声的文本,你可以尝试以下这些技巧,这些技巧摘自coursera上的在线课程:“改进深层神经网络:超参数调整、正则化和优化”安德鲁教授天然气:</p>
<p>1-训练你的数据在正常和清晰的文本图像上,因为
它可以让你的算法从清晰的图像中学习很多特征和初始属性,比如字母的形状,有时你可能会对结果感到惊讶。在</p>
<p>2-让你的<strong>开发</strong>集(以及你的测试集)包含大量嘈杂的文本图像,这样你就可以检查你的算法对你真正关心的数据的处理效果如何(<strong>你的目标</strong>)</p>
<p>3-改变数据集可能有点困难,但如果噪音使foto的一部分变得连人类都难以阅读,那么这个数据集可能就没用了
因此,你可以带来一个噪声清晰的图像,并将它们与噪声图像混合(从旧的数据集中创建一个新的数据集),使其保持真实,而不是太机械化,然后根据新数据训练算法。在</p>
<p>构建一个好的ML算法或应用程序首先取决于您的数据,而这些只是一些符号,可能有助于您以另一种方式思考问题。在</p>