神经网络参数初始化的常见方法

news/2024/8/26 18:20:39 标签: 神经网络, 人工智能, 深度学习

参数初始化

bias偏置:直接初始化为0
weight权重:

  • 随机初始化

    • 在高斯分布的数据中随机采样
  • 标准初始化

    • 在均匀分布的随机数中采样
  • Xavier初始化
    该方法的基本思想是各层的激活值和梯度的方差在传播过程中保持一致,也叫做Glorot初始化。

    • 正态化Xavier初始化
      在这里插入图片描述

      import tensorflow as tf
      #正态分布的
      #实例化
      initializer = tf.keras.initializers.glorot_normal()
      values = initializer((9,1))
      print(values)
      
    • 标准化Xavier初始化

      在这里插入图片描述

      import tensorflow as tf
      #标准化的
      initializer = tf.keras.initializers.glorot_uniform()
      values = initializer((9,1))
      print(values)
      
  • He初始化

    he初始化也称Kaiming初始化,出自大神何凯明之手,它的基本思想是正向传播时,激活值的方差保持不变;反向传播时,关于状态值的梯度的方差保持不变。

    • 正态化的he初始化

      在这里插入图片描述

      import tensorflow as tf
      #正态分布
      initializer = tf.keras.initializers.he_normal()
      #采样得到权重
      values = initializer((9,1))
      print(values)
      
    • 标准化的he初始化

      在这里插入图片描述

      import tensorflow as tf
      #标准化-均匀分布
      initializer = tf.keras.initializers.he_uniform()
      #采样得到权重
      values = initializer((9,1))
      print(values)
      

http://www.niftyadmin.cn/n/5558359.html

相关文章

2407-mysql笔记

数据库(Database),简称db mariadbmysql 常见的数据库:mysql、oracle、高斯(Gauss)、redis、sqlserver、SQLite、HBase 一、SQL(Structured Query Language):结构化查询语言 1、作用&#xff…

【46 Pandas+Pyecharts | 当当网畅销图书榜单数据分析可视化】

文章目录 🏳️‍🌈 1. 导入模块🏳️‍🌈 2. Pandas数据处理2.1 读取数据2.2 查看数据信息2.3 去除重复数据2.4 书名处理2.5 提取年份 🏳️‍🌈 3. Pyecharts数据可视化3.1 作者图书数量分布3.2 图书出版年份…

园区道路车辆智能管控视频解决方案,打造安全畅通的园区交通环境

一、背景需求分析 随着企业园区的快速发展和扩张,道路车辆管理成为了保障园区秩序、提升运营效率及确保员工安全的重要任务。针对这一需求,旭帆科技TSINGSEE青犀提出了一种企业园区道路车辆管控的解决方案,通过整合视频监控、智能识别等技术…

Qt | 绘制直线与 QLineF 类

点击上方"蓝字"关注我们 01、绘制直线 02、Qline和QLineF 【1】QLine 是整型版本,成员函数较少,QLineF 是精度更高的浮点型版本,本文以 QLineF 类 进行讲解。 QLineF 类提供了一个二维向量,使用 QLineF 类绘制直线可以利用该类中的成员函数方便 的对线条的属…

redis安装,启动客户端、验证(redis第一次作业)

Redis简介 全称: mote ctionary erver (远程字典服务器)。是完全开源免费的,用 C 语言编写的,遵守 BSD协议。是一个高性能的 (key/value) 分布式内存数据库,基于内存运行并支持持久化的 NoSQL 数据库&#…

京东Android一面凉经(2024)

京东Android一面凉经(2024) 笔者作为一名双非二本毕业7年老Android, 最近面试了不少公司, 目前已告一段落, 整理一下各家的面试问题, 打算陆续发布出来, 供有缘人参考。今天给大家带来的是《京东Android一面凉经(2024)》。 面试职位: Android开发工程师 技术一面 面试时长: 50…

Pytorch学习笔记day1—— 安装教程

这里写自定义目录标题 Pytorch安装方式 工作需要,最近开始搞一点AI的事情。但是这个国产的AI框架,实话说对初学者不太友好 https://www.mindspore.cn/ 比如说它不支持win下的CUDA,可是我手里只有3070Ti和4060也不太可能自己去买昇腾就有点绷不…

DVC+Minio

由于参数文件比较大,因此onnx、engine等大文件弃用LFS管理,改用dvc管理: minio就是存储用的 启动miniosudo netstat -ntpl#查看端口号 sudo kill -9 $(sudo lsof -i:5061 -t) 关闭端口对应进程 ./minio server --console-address ":6570…