当前位置：首页 > 编程笔记 > 正文

已解决

神经网络 02(激活函数)

来自网友在路上 187887提问提问时间：2023-09-18 22:44:49阅读次数： 87

最佳答案问答题库878位专家为你答疑解惑

一、激活函数

在神经元中引入了激活函数，它的本质是向神经网络中引入非线性因素的，通过激活函数，神经网络就可以拟合各种曲线。

如果不用激活函数，每一层输出都是上层输入的线性函数，无论神经网络有多少层，输出都是输入的线性组合;
引入非线性函数作为激活函数，那输出不再是输入的线性组合，可以逼近任意函数。

激活函数的作用：

增加模型的非线性分割能力

提高模型鲁棒性
缓解梯度消失问题
加速模型收敛等

常用的激活函数

1.1 Sigmoid/logistics函数

sigmoid 在定义域内处处可导，且两侧导数逐渐趋近于0。

如果X的值很大或者很小的时候，那么函数的梯度 (函数的斜率)会非常小，在反向传播的过程中，导致了向低层传递的梯度也变得非常小。此时，网络参数很难得到有效训练。这种现象被称为梯度消失。

一般来说，sigmoid 网络在5层之内就会产生梯度消失现象。而且，该激活函数并不是以0为中心的，所以在实践中这种激活函数使用的很少。sigmoid函数一般只用于二分类的输出层。

# 导入相应的工具包
import tensorflow as tf
import tensorflow.keras as keras
import matplotlib.pyplot as plt
import numpy as np
# 定义x的取值范围
x = np.linspace(-10, 10, 100)
# 直接使用tensorflow实现
y = tf.nn.sigmoid(x)
# 绘图
plt.plot(x,y)
plt.grid()

1.2 tanh(双曲正切曲线)

tanh 也是一种非常常见的激活函数。与 sigmoid 相比，它是以 0 为中心的，使得其收敛速度要比 sigmoid 快（相比之下，tanh 曲线更为陡峭一些），减少迭代次数。然而，从图中可以看出，tanh 两侧的导数也为 0，同样会造成梯度消失。

# 导入相应的工具包
import tensorflow as tf
import tensorflow.keras as keras
import matplotlib.pyplot as plt
import numpy as np
# 定义x的取值范围
x = np.linspace(-10, 10, 100)
# 直接使用tensorflow实现
y = tf.nn.tanh(x)
# 绘图
plt.plot(x,y)
plt.grid()

1.3 RELU

ReLU是目前最常用的激活函数。从图中可以看到，当x<0时，ReLU导数为0，而当x>0时，则不存在饱和问题。所以，ReLU 能够在x>0时保持梯度不衰减，从而缓解梯度消失问题。然而，随着训练的推进，部分输入会落入小于0区域，导致对应权重无法更新。这种现象被称为“神经元死亡”。

Relu是输入只能大于0,如果你输入含有负数，Relu就不适合，如果你的输入是图片格式，Relu就挺常用的，因为图片的像素值作为输入时取值为[0,255]。

与sigmoid相比，RELU的优势是：

采用sigmoid函数，计算量大（指数运算），反向传播求误差梯度时，求导涉及除法，计算量相对大，而采用Relu激活函数，整个过程的计算量节省很多。
sigmoid函数反向传播时，很容易就会出现梯度消失的情况，从而无法完成深层网络的训练。
Relu会使一部分神经元的输出为0，这样就造成了网络的稀疏性，并且减少了参数的相互依存关系，缓解了过拟合问题的发生。

# 导入相应的工具包
import tensorflow as tf
import tensorflow.keras as keras
import matplotlib.pyplot as plt
import numpy as np
# 定义x的取值范围
x = np.linspace(-10, 10, 100)
# 直接使用tensorflow实现
y = tf.nn.relu(x)
# 绘图
plt.plot(x,y)
plt.grid()

1.4 LeakyReLu

1.5 SoftMax

softmax用于多分类过程中，它是二分类函数 sigmoid 在多分类上的推广，目的是将多分类的结果以概率的形式展现出来。

softmax 直白来说就是将网络输出的 logits 通过softmax函数，就映射成为(0,1)的值，而这些值的累和为1（满足概率的性质），那么我们将它理解成概率，选取概率最大（也就是值对应最大的）接点，作为我们的预测目标类别。

Logits 是神经网络输出层的原始得分或未经激活函数处理的值。在深度学习中，通常将 logits 用于多类别分类问题，其中每个类别都对应于一个可能的类别。Logits 是模型对每个类别的得分，模型会根据这些得分来进行分类决策。

通常，神经网络的最后一层会生成 logits。然后，通过应用 softmax 激活函数，将 logits 转换为每个类别的概率分布。Softmax 操作将 logits 映射到概率值，使得它们的总和等于1。这样，可以选择具有最高概率的类别作为最终的分类结果。

# 导入相应的工具包
import tensorflow as tf
import tensorflow.keras as keras
import matplotlib.pyplot as plt
import numpy as np
# 数字中的score
x = tf.constant([0.2,0.02,0.15,0.15,1.3,0.5,0.06,1.1,0.05,3.75])
# 将其送入到softmax中计算分类结果
y = tf.nn.softmax(x) 
# 将结果进行打印
print(y)

1.6 其他激活函数

二、如何选激活函数

2.1 隐藏层

优先选择RELU激活函数
如果ReLu效果不好，那么尝试其他激活，如Leaky ReLu等。
如果你使用了Relu，需要注意一下Dead Relu问题，避免出现大的梯度从而导致过多的神经元死亡。
不要使用sigmoid激活函数，可以尝试使用tanh激活函数

2.2 输出层

二分类问题选择sigmoid激活函数
多分类问题选择softmax激活函数
回归问题选择identity激活函数

查看全文

/2175416.html

华为云云耀云服务器L实例评测|一个2C2G3M的云服务器能做哪些有有趣的事儿？

有效的括号（栈的高频面试题）

【数据结构】堆的应用+TOP-K问题+二叉树遍历

数据库连接工具Chat2DB介绍

C# 流Stream详解（3）——FileStream源码

Vue Grid Layout -️ 适用Vue.js的栅格布局系统，在vue3+上使用

[maven] maven 创建 web 项目并嵌套项目

vue3-vant4-vite-pinia-axios-less学习日记

二叉树题目：层数最深叶子结点的和

Java手写约瑟夫问题算法和约瑟夫问题算法应用拓展案例

innovus: 各种padding一勺烩

简单的分析下dart实现grpc客户端的流程,以helloworld为例

stm32--独立看门狗

GcExcel:Java 应用创建、修改和保存 Excel 电子表格 -Crack

腾讯mini项目-【指标监控服务重构】2023-08-19

leetcode363周赛

new/delete, malloc/free 内存泄漏如何检测

无涯教程-JavaScript - ODD函数

阿里云无影电脑：免费体验无影云电脑3个月

嵌入式学习笔记（25）串口通信的基本原理

前后端分离技术逐步深入，让你更加深入理解Nginx+Tomcat

Linux学习第11天：字符设备驱动开发：一字一符总见情

windows彻底卸载unity

前端html原生页面兼容多端H5和移动端适配方案

系统性能调优：提升服务器响应速度

PHP通过pem文件校验签名异常

【C++ Exceptions】Catch exceptions by reference！

科技资讯|苹果虚拟纸可在Vision Pro中为广告、书籍等提供MR内容和动画

webpack静态资源上传到CDNS （阿里云 OSS，亚马逊 AWS S3，七牛云 Qiniu Cloud Kodo）webpack-plugin-cdns

VMware workstation 中centos7虚拟机在nat模式下怎么配置网卡，指定我想要的IP并且可以联网

Flask 使用 JWT（一）

【ant-design-vue】ant-design-vue在uniapp使用时，auto-import失败报错

一文通览腾讯云大数据ES、数据湖计算、云数据仓库产品新版本技术创新

cuda以及pytorch安装

Xilinx FPGA 7系列 GTX/GTH Transceivers (2)--IBERT

oracle创建数据库以及用户，并导入dmp格式数据

每个高级前端工程师都应该知道的前端布局

微软发现影响 Linux 和 macOS系统的 ncurses 库漏洞

前后端开发接口联调对接参数

线性代数的本质(一)——向量空间

Maven 工具学习笔记（基础）

reg与wire的用法，证明reg可以在右边，wire型在左边，来作组合逻辑处理。

【JDK 8-函数式编程】4.5 Predicate

html网页制作期末大作业-网上花店商城html+css+javascript

2023年11月25日PMP报名正式开始！附操作指南

伦敦银时走势与获利机会

【数据结构】单值二叉树相同的树翻转二叉树（五）

从0搭建夜莺v6基础监控告警系统（一）：基础服务安装

three.js——模型对象的使用材质和方法

Java手写红黑树

华为HCIA（四）

MyBatis面试题(一)

ARM cortex-A7核LED灯点灯实验

vue学习-01vue入门

K8s(Kubernetes)学习（六）——Ingress

8种LED显示屏的安装方式

zabbix学习1--zabbix6.x单机

一文了解水雨情在线监测站的优势

QSlider风格设置

GaussDB（DWS）云原生数仓技术解析：湖仓一体，体验与大数据互联互通

项目性能优化 - 并发编程合并文章详情页的 HTTP 请求次数

linux基础篇

MATLAB中filloutliers函数用法

蓝桥杯2023年第十四届省赛真题-买瓜--Java题解

OpenText EnCase Mobile Investigator 查看、分析和报告被调查手机的证据

83 # 静态服务中间件 koa-static 的使用以及实现

计算机网络第四章——网络层（下）

09MyBatisX插件

JMeter基础 —— 使用Badboy录制JMeter脚本！

蓝牙核心规范（V5.4）10.1-BLE 入门笔记（1）

Java实现图书管理系统

评价模型：层次分析法

【免费内网穿透】cpolar从0开始使用

面试中常见的算法题和其python实现

flask+python快速搭建

手把手教你搭建农产品商城小程序：详细步骤解析

信息化助力高校教育统计数据质量的提升

4G模块驱动移植

软件测试团队必看：测试指标 TOP 3 榜单

【seata】引入seata导致原本自定义实现的RequestInterceptor失效

SSM - Springboot - MyBatis-Plus 全栈体系（七）

TypeScript逆变：条件、推断和泛型的应用

OpenStack创建云主机并连接CRT

04Spring的核心配置文件

构建个人图床云盘—EasyImage的简单部署及远程访问配置

计算机网络选择题笔记

【AI语言大模型】文心一言功能使用介绍

JSP ssm 网上求职管理系统myeclipse开发mysql数据库springMVC模式java编程计算机网页设计

2021年电工杯数学建模A题高铁牵引供电系统运行数据分析及等值建模求解全过程论文及程序

List 获取前N条数据

虹科分享 | 来自Redis7.2的一封信：亲爱的Programmer，当你......

抖音小店经营指南：在兴趣电商背景下打造成功的抖音店铺

ts 泛型基础介绍

AOSP Android 系统源码编译出的framework.jar和android.jar之间的区别

【实战】H5 页面同时适配 PC 移动端 —— 旋转横屏

代码随想录算法训练营第55天 | ● 392.判断子序列 ● 115.不同的子序列

构建本地Web小游戏网站：Ubuntu下的快速部署与公网用户远程访问

Unity中UI组件对Shader调色

PostgreSQL serial类型

redis 哨兵（sentinel）机制

99%的人还看了

相似问题

猜你感兴趣

版权申明

本文"神经网络 02(激活函数)"：http://eshow365.cn/6-8931-0.html 内容来自互联网，请自行判断内容的正确性。如有侵权请联系我们，立即删除！

晴海小常识分享

晴海小常识分享

神经网络 02(激活函数)

最佳答案问答题库878位专家为你答疑解惑

一、激活函数

1.1 Sigmoid/logistics函数

1.2 tanh(双曲正切曲线)

1.3 RELU

1.4 LeakyReLu

1.5 SoftMax

1.6 其他激活函数

二、如何选激活函数

2.1 隐藏层

2.2 输出层

相关文章：

99%的人还看了

相似问题

猜你感兴趣

版权申明

推荐回答

晴海小常识分享

晴海小常识分享

神经网络 02(激活函数)

最佳答案 问答题库878位专家为你答疑解惑

一、激活函数

1.1 Sigmoid/logistics函数

1.2 tanh(双曲正切曲线)

1.3 RELU

1.4 LeakyReLu

1.5 SoftMax

1.6 其他激活函数

二、如何选激活函数

2.1 隐藏层

2.2 输出层

相关文章：

99%的人还看了

相似问题

猜你感兴趣

版权申明

推荐回答

最佳答案问答题库878位专家为你答疑解惑