当前位置: 首页 > news >正文

损失函数专题

这段时间在看一篇文章,但是当文章讲到损失函数部分时我就开始有点模糊了,因为我记不起来损失函数的相关数学概念了,那就从下面三个方面来对知识点进行巩固:

  • 损失函数基本概念
  • 损失函数数学原理
  • 常见损失函数

1. 损失函数基础概念:是衡量模型预测结果与真实标签之间差异的数学函数

在监督学习中,我们的核心目标是找到最优参数 ,使得损失函数最小化:

2. 损失函数数学原理:

比较两个概率模型(一个是确定的现实模型,一个是我们设计的概率模型)

1最小二乘法:

这里的1/2是为了求导方便

2最大似然:

概率是从事件推结果,似然是从结果(概率)推事件

似然函数的推导过程:

这里使用log将连乘变成连加(同时log不改变其单调性)

添加-号将寻找最大值问题变成寻找最小值

3信息论基础:

不同类型的模型可以使用熵来进行统一衡量,熵越大越混乱,此处应该寻找熵的最小值

信息量:一个系统从不确定变得确定难度有多大

为满足逻辑(下图公式2)自洽则信息量公式中应该有log

熵的计算公式:

相对熵(KL散度):这里是以P为基准,看Q与P的距离

交叉熵:(这里P是人脑对应的模型,Q是用于分类的模型,此任务用于判断是不是猫)

3. 较为常见的损失函数两类:

(1)均方差损失函数(MSE)

通过计算模型预测值与真实值之间差值的平方的平均值,衡量回归任务中预测结果的准确性,旨在使预测值尽可能接近真实值。

(2)交叉熵损失函数(CE)

用于衡量分类任务中模型预测的概率分布与真实标签之间的差异,旨在通过最小化损失来使模型预测更加接近真实类别。

结合不同任务特性选用适配的损失函数,可参考知乎文章:(59 封私信 / 30 条消息) 深度学习损失函数完全指南:理论、实现与应用 - 知乎

http://www.cnnetsun.cn/news/19487.html

相关文章:

  • 探索数字经济前沿:2025国际期刊/国际会议
  • Windows热键冲突检测利器:Hotkey Detective深度解析
  • MELD多模态情感识别:如何让AI真正理解对话中的情感变化?
  • 创意AI应用开发大赛 - 基于Google AI Studio的创新实践指南
  • AI是风口还是泡沫?一个独立开发者的冷思考
  • 喜马拉雅下载工具终极指南:快速实现离线音频批量管理
  • 校务管理|基于Java+ vue校务管理系统(源码+数据库+文档)
  • 酒店预约|基于Java+ vue酒店预约系统(源码+数据库+文档)
  • 校园社团|基于springboot 校园社团管理系统(源码+数据库+文档)
  • 个人博客|基于springboot个人博客系统(源码+数据库+文档)
  • VideoReTalking技术深度探索:解锁视频配音的无限可能
  • 测试工程师的沟通与报告技巧
  • Morisawa BIZ UDGothic 字体完全指南:提升文档易读性的终极选择
  • 深度解析《2025 中国 RFID 无源物联网产业白皮书》:技术架构、开发实践与万亿级赛道机遇
  • 如何用机器学习解锁Social_Network_Ads用户购买密码?3天实战完整指南
  • AI代理协作系统部署与监控实战指南
  • 一键搞定专业影棚光效!Dimension 2025 助力品牌视觉升级最新下载安装步骤
  • GLM-4-9B全面解析:开源大模型如何重塑企业AI应用格局
  • 3分钟快速上手:Qwen3-VL多模态AI模型的完整使用指南
  • 动态GIF库gif-h使用教程
  • 【酒馆玩家必看】Claude平替找到了?OpenRouter榜单第二的隐藏神模DeepSeek R1T2,究竟有多强?
  • 电池行业全景分析:产业链、上市企业与职业发展指南
  • Python性能测试神器:pyperf基准测试工具深度解析
  • 中小微企业有必要做企业微信私域吗?2025年企业微信私域低成本实战指南
  • 企业开发中如何批量解决pip环境问题
  • CppSharp终极指南:轻松实现C++到.NET的无缝集成
  • AI如何解决‘Unable to Connect to Anthropic Services‘错误
  • ​​​​​​​拼多多API应用场景大揭秘,让你的店铺玩法多样!
  • 蓝牙模块介绍
  • 电商系统实战:Java Base64图片处理全流程