tensorflow的权归一层

tfwn的Python项目详细描述


Tfwn

Weight NormalizationTensorFlow Keras API的层包装器。

灵感来自Sean Morgan实现,但是:

  • 没有数据初始化(在原始拉取请求中只实现了紧急模式)。
  • 代码重构
  • 更多测试
  • CIFAR10重新实现的原始纸张示例

示例

不幸的是,我无法在批处理大小为100的cifar10上复制更精确的结果。 如你所见,准确度没有太大差别。

但是,对于小批量的模型,权重归一化要比常规模型好得多。

如何使用

importtensorflowastffromtfwnimportWeightNormdense_wn=WeightNorm(tf.keras.layers.Dense(3))out=dense_wn(input)

参考文献

权重规范化:一个简单的重新参数化,以加速深层神经网络的训练

蒂姆·萨利曼斯和迪德里克·P·金马。

@inproceedings{Salimans2016WeightNorm,
  title={Weight Normalization: A Simple Reparameterization to Accelerate Training of Deep Neural Networks},
  author={Tim Salimans and Diederik P. Kingma},
  booktitle={Neural Information Processing Systems 2016},
  year={2016}
}

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
Java:如何使用另一个类中的对象   如何在Java中迭代旁遮普语(阿拉伯语)?   类Java嵌套ArrayList返回对象   java正则表达式以匹配“:”之后包含的字符串   java为什么main()很好地显示“Lukaku”并包含_names()返回null?   java嵌套循环,无法理解如何编写此代码   java使用maven动物嗅探器插件检查自己的API   java上传的文件创建保存以备将来在GWT服务器端使用   java转换为Dalvik格式失败65536限制   Java后端的javascript最佳RIA工具   amazon web服务如何将tar文件从amazonS3 bucket提取到Java中的另一个s3   java如何在hibernate搜索中实现对int值的搜索?   使用Maven初始化引导层JavaFX时发生java错误   java Google登录API例外:10:   java Glassfish 3.1.2加载本机库(.dll)   java在join操作中使用TumblingWindow,但没有将任何元素传输到my JoinFunction   IBatis+Java:检索HashMap   多线程java与scala在单独线程上读取文件