Could anyone suggest a way of defining the computational complexity of a neural network after quantization?
我将计算复杂性理解为计算整个网络或单个层所需的算术“工作量”。然而,当神经网络被量化时,数字不再以相同的格式表示(新格式将取决于所述的量化方法,例如here)
我们从所有运算中的两个实数相乘开始,将int8,float 16等的对相乘。后一种运算显然比两个实数相乘“更简单”
因此,这会影响执行计算所需的时间和内存,因此,传统的度量,例如“BigO”表示法,没有意义
目前没有回答
相关问题 更多 >
编程相关推荐