网站首页 > 技术文章 正文
在前面的文章中,我们已经学习了TensorFlow激励函数的操作使用方法(见文章:快速掌握TensorFlow(三)),今天我们将继续学习TensorFlow。
本文主要是学习掌握TensorFlow的损失函数。
一、什么是损失函数
损失函数(loss function)是机器学习中非常重要的内容,它是度量模型输出值与目标值的差异,也就是作为评估模型效果的一种重要指标,损失函数越小,表明模型的鲁棒性就越好。
二、怎样使用损失函数
在TensorFlow中训练模型时,通过损失函数告诉TensorFlow预测结果相比目标结果是好还是坏。在多种情况下,我们会给出模型训练的样本数据和目标数据,损失函数即是比较预测值与给定的目标值之间的差异。
下面将介绍在TensorFlow中常用的损失函数。
1、回归模型的损失函数
首先讲解回归模型的损失函数,回归模型是预测连续因变量的。为方便介绍,先定义预测结果(-1至1的等差序列)、目标结果(目标值为0),代码如下:
import tensorflow as tf sess=tf.Session() y_pred=tf.linspace(-1., 1., 100) y_target=tf.constant(0.)
注意,在实际训练模型时,预测结果是模型输出的结果值,目标结果是样本提供的。
(1)L1正则损失函数(即绝对值损失函数)
L1正则损失函数是对预测值与目标值的差值求绝对值,公式如下:
在TensorFlow中调用方式如下:
loss_l1_vals=tf.abs(y_pred-y_target) loss_l1_out=sess.run(loss_l1_vals)
L1正则损失函数在目标值附近不平滑,会导致模型不能很好地收敛。
(2)L2正则损失函数(即欧拉损失函数)
L2正则损失函数是预测值与目标值差值的平方和,公式如下:
当对L2取平均值,就变成均方误差(MSE, mean squared error),公式如下:
在TensorFlow中调用方式如下:
# L2损失 loss_l2_vals=tf.square(y_pred - y_target) loss_l2_out=sess.run(loss_l2_vals) # 均方误差 loss_mse_vals= tf.reduce.mean(tf.square(y_pred - y_target)) loss_mse_out = sess.run(loss_mse_vals)
L2正则损失函数在目标值附近有很好的曲度,离目标越近收敛越慢,是非常有用的损失函数。
L1、L2正则损失函数如下图所示:
(3)Pseudo-Huber 损失函数
Huber损失函数经常用于回归问题,它是分段函数,公式如下:
从这个公式可以看出当残差(预测值与目标值的差值,即y-f(x) )很小的时候,损失函数为L2范数,残差大的时候,为L1范数的线性函数。
Peseudo-Huber损失函数是Huber损失函数的连续、平滑估计,在目标附近连续,公式如下:
该公式依赖于参数delta,delta越大,则两边的线性部分越陡峭。
在TensorFlow中的调用方式如下:
delta=tf.constant(0.25) loss_huber_vals = tf.mul(tf.square(delta), tf.sqrt(1. + tf.square(y_target – y_pred)/delta)) – 1.) loss_huber_out = sess.run(loss_huber_vals)
L1、L2、Huber损失函数的对比图如下,其中Huber的delta取0.25、5两个值:
2、分类模型的损失函数
分类损失函数主要用于评估预测分类结果,重新定义预测值(-3至5的等差序列)和目标值(目标值为1),如下:
y_pred=tf.linspace(-3., 5., 100) y_target=tf.constant(1.) y_targets=tf.fill([100, ], 1.)
(1)Hinge损失函数
Hinge损失常用于二分类问题,主要用来评估向量机算法,但有时也用来评估神经网络算法,公式如下:
在TensorFlow中的调用方式如下:
loss_hinge_vals = tf.maximum(0., 1. – tf.mul(y_target, y_pred)) loss_hinge_out = sess.run(loss_hinge_vals)
上面的代码中,目标值为1,当预测值离1越近,则损失函数越小,如下图:
(2)两类交叉熵(Cross-entropy)损失函数
交叉熵来自于信息论,是分类问题中使用广泛的损失函数。交叉熵刻画了两个概率分布之间的距离,当两个概率分布越接近时,它们的交叉熵也就越小,给定两个概率分布p和q,则距离如下:
对于两类问题,当一个概率p=y,则另一个概率q=1-y,因此代入化简后的公式如下:
在TensorFlow中的调用方式如下:
loss_ce_vals = tf.mul(y_target, tf.log(y_pred)) – tf.mul((1. – y_target), tf.log(1. – y_pred)) loss_ce_out = sess.run(loss_ce_vals)
Cross-entropy损失函数主要应用在二分类问题上,预测值为概率值,取值范围为[0,1],损失函数图如下:
(3)Sigmoid交叉熵损失函数
与上面的两类交叉熵类似,只是将预测值y_pred值通过sigmoid函数进行转换,再计算交叉熵损失。在TensorFlow中有内置了该函数,调用方式如下:
loss_sce_vals=tf.nn.sigmoid_cross_entropy_with_logits(y_pred, y_targets) loss_sce_out=sess.run(loss_sce_vals)
由于sigmoid函数会将输入值变小很多,从而平滑了预测值,使得sigmoid交叉熵在预测值离目标值比较远时,其损失的增长没有那么的陡峭。与两类交叉熵的比较图如下:
(4)加权交叉熵损失函数
加权交叉熵损失函数是Sigmoid交叉熵损失函数的加权,是对正目标的加权。假定权重为0.5,在TensorFlow中的调用方式如下:
weight = tf.constant(0.5) loss_wce_vals = tf.nn.weighted_cross_entropy_with_logits(y)vals, y_targets, weight) loss_wce_out = sess.run(loss_wce_vals)
(5)Softmax交叉熵损失函数
Softmax交叉熵损失函数是作用于非归一化的输出结果,只针对单个目标分类计算损失。
通过softmax函数将输出结果转化成概率分布,从而便于输入到交叉熵里面进行计算(交叉熵要求输入为概率),softmax定义如下:
结合前面的交叉熵定义公式,则Softmax交叉熵损失函数公式如下:
在TensorFlow中调用方式如下:
y_pred=tf.constant([[1., -3., 10.]] y_target=tf.constant([[0.1, 0.02, 0.88]]) loss_sce_vals=tf.nn.softmax_cross_entropy_with_logits(y_pred, y_target) loss_sce_out=sess.run(loss_sce_vals)
用于回归相关的损失函数,对比图如下:
3、总结
下面对各种损失函数进行一个总结,如下表所示:
在实际使用中,对于回归问题经常会使用MSE均方误差(L2取平均)计算损失,对于分类问题经常会使用Sigmoid交叉熵损失函数。
大家在使用时,还要根据实际的场景、具体的模型,选择使用的损失函数,希望本文对你有帮助。
接下来的“快速掌握TensorFlow”系列文章,还会有更多讲解TensorFlow的精彩内容,敬请期待。
欢迎关注本人的微信公众号“大数据与人工智能Lab”(BigdataAILab),获取更多信息
推荐相关阅读
- 【AI实战】快速掌握TensorFlow(一):基本操作
- 【AI实战】快速掌握TensorFlow(二):计算图、会话
- 【AI实战】快速掌握TensorFlow(三):激励函数
- 【AI实战】快速掌握TensorFlow(四):损失函数
- 【AI实战】搭建基础环境
- 【AI实战】训练第一个模型
- 【AI实战】编写人脸识别程序
- 【AI实战】动手训练目标检测模型(SSD篇)
- 【AI实战】动手训练目标检测模型(YOLO篇)
- 【精华整理】CNN进化史
- 大话卷积神经网络(CNN)
- 大话循环神经网络(RNN)
- 大话深度残差网络(DRN)
- 大话深度信念网络(DBN)
- 大话CNN经典模型:LeNet
- 大话CNN经典模型:AlexNet
- 大话CNN经典模型:VGGNet
- 大话CNN经典模型:GoogLeNet
- 大话目标检测经典模型:RCNN、Fast RCNN、Faster RCNN
- 大话目标检测经典模型:Mask R-CNN
- 27种深度学习经典模型
- 浅说“迁移学习”
- 什么是“强化学习”
- AlphaGo算法原理浅析
- 大数据究竟有多少个V
- Apache Hadoop 2.8 完全分布式集群搭建超详细教程
- Apache Hive 2.1.1 安装配置超详细教程
- Apache HBase 1.2.6 完全分布式集群搭建超详细教程
- 离线安装Cloudera Manager 5和CDH5(最新版5.13.0)超详细教程
关注本人公众号“大数据与人工智能Lab”(BigdataAILab),获取更多信息。
参考文献:K码农-http://kmanong.top/kmn/qxw/form/home?top_cate=28
- 上一篇: Python实现机器学习算法——Lasso回归
- 下一篇: 机器学习的中“损失函数”是指什么?
猜你喜欢
- 2024-10-12 淘宝首页那些“辣眼睛”的图去哪了?
- 2024-10-12 基于AI的超分辨技术在RTC领域的技术难点与挑战
- 2024-10-12 最炫酷的损失函数 损失函数有哪些,分别用在什么地方
- 2024-10-12 机器学习的中“损失函数”是指什么?
- 2024-10-12 1张图2分钟转3D!纹理质量、多视角一致性新SOTA|北大出品
- 2024-10-12 Python实现机器学习算法——Lasso回归
- 2024-10-12 多重共线性是如何影响回归模型的 多重共线性的存在会影响模型在预测上的应用
- 2024-10-12 神经网络算法 - 一文搞懂Loss Function(损失函数)
- 2024-10-12 谷歌大脑:只要网络足够宽,激活函数皆可抛
- 2024-10-12 深度学习:我应该使用哪些损失函数和激活函数?
你 发表评论:
欢迎- 最近发表
- 标签列表
-
- oraclesql优化 (66)
- 类的加载机制 (75)
- feignclient (62)
- 一致性hash算法 (71)
- dockfile (66)
- 锁机制 (57)
- javaresponse (60)
- 查看hive版本 (59)
- phpworkerman (57)
- spark算子 (58)
- vue双向绑定的原理 (68)
- springbootget请求 (58)
- docker网络三种模式 (67)
- spring控制反转 (71)
- data:image/jpeg (69)
- base64 (69)
- java分页 (64)
- kibanadocker (60)
- qabstracttablemodel (62)
- java生成pdf文件 (69)
- deletelater (62)
- com.aspose.words (58)
- android.mk (62)
- qopengl (73)
- epoch_millis (61)
本文暂时没有评论,来添加一个吧(●'◡'●)