当前位置: 首页 > news >正文

06.什么是偏差-方差权衡?

“偏差-方差权衡”简介

在机器学习 (ML) 和人工智能 (AI) 中,偏差-方差权衡是一个治理预测性机器学习模型性能的概念,也是数据科学的基本原则。

当我们决定为某个特定的业务问题构建 ML 模型时,我们希望选择一种能够最大限度减少误差并捕捉潜在信号的模型架构。偏差和方差代表预测误差的两个来源。偏差可以衡量由于过于简单化的假设而导致的预测与真实值的差距,而方差则捕捉基于不同训练数据的预测波动程度。

要构建能够很好地概括未见数据的模型,了解和管理这种权衡至关重要。偏差较大的模型容易出现欠拟合,从而丢失重要模式,而方差较大的模型容易出现过拟合,从而将噪声像信号一样捕捉。达到正确的平衡是有效机器学习设计的核心,也有助于解释为什么在训练数据方面表现良好的模型在现实世界中仍然可能失败。

在本阅读解释器中,我们深入探讨偏差-方差权衡和预测误差的技术细节,描绘如何为数据集构建正确的模型。

权衡图解

在线性回归或 K 最近邻(KNN)等预测模型中,偏差和方差是相互依存的:

  • 偏差衡量的是模型预测与真实值的平均偏差。高偏差模型往往会对数据的形式做出强烈的假设并导致欠拟合。过于简单的模型往往偏差大、方差小,这样的模型往往训练误差大、预测误差大。
  • 方差衡量的是模型的预测随不同训练数据集的变化程度。高方差模型对训练数据中的噪声很敏感,并导致过拟合。结构复杂、参数较多的模型往往具有高方差和低偏差的特征。

    在本阅读解释器中,我们以线性回归为例来说明模型复杂性如何影响预测结果的偏差和方差。回想一下,在线性回归中,评估指标由均方误差 (MSE) 定义:真实值与预测值之间的平均平方误差。较大的 MSE 表示模型与训练数据的拟合度较差,而较小的 MSE 表示模型与训练数据的拟合度较好。

MSE 定义为:
M S E = ( y p r e d − y a c t u a l ) 2 MSE=(ypred-yactual)2MSE=(ypredyactual)2
或表示为残差平方和:
R S S = ∑ i = 1 n ( y i − y i ) 2 RSS=∑i=1n(yi-yi^)2RSS=i=1n(yiyi)2
假设我们有了一组输入值 X 和相应的输出值 Y。X 和 Y 之间的真实关系是非线性的 — 想象成一个平滑的、弯曲的 U 形,就像正弦波一样。但我们并不知道其潜在功能。相反,我们观测到的是与之近似的噪声数据点。

我们现在要建立一个模型,通过 X 来预测 Y。

为了说明模型复杂性如何影响性能,我们可以尝试拟合三个复杂性不断增加的模型:一个线性模型、一个中等复杂度的多项式模型和一个非常复杂的多项式模型。

这种噪声组成引入了随机性,模拟真实世界的数据。多项式是涉及 X 的幂乘以系数之和的数学表达式。

例如,1 阶多项式为:
y = β 0 + β 1 x y^=β0+β1xy=β0+β1x
该模型表示为一条直线:

该模型非常简单,并强烈假设 X 和 Y 之间是线性关系。但数据明显呈现曲线模式。结果:

  • 偏差高:模型无法捕捉数据中的非线性模式。
  • 方差低:稳定,在不同的数据集上变化不大。
  • MSE(均方误差):0.2929。相对较高。

这是一个欠拟合示例 — 模型太简单,无法学习真实的结构。

4 阶多项式为
y = β 0 + β 1 x + β 2 x 2 + β 3 x 3 + β 4 x 4 y^=β0+β1x+β2x2+β3x3+β4x4y=β0+β1x+β2x2+β3x3+β4x4

现在我们使用一个包含 x 的幂的多项式,其上限为 x4 :
y = β 0 + β 1 x + β 2 x 2 + β 3 x 3 + β 4 x 4 y^=β0+β1x+β2x2+β3x3+β4x4y=β0+β1x+β2x2+β3x3+β4x4
该模型足够复杂,可以捕捉数据曲线,而不会对噪声太敏感。

  • 偏差适中:模型能较好地代表真实函数。
  • 方差适中:不会对数据中的微小波动反应过度。
  • MSE:约为 0.0714,低于 1 阶。

这是我们示例中表现最好的模型,具有很好的通用性。

25 阶多项式为:
y = ∑ i = 025 β i x i y^=∑i=025βixiy=i=025βi</

http://www.cnnetsun.cn/news/143275.html

相关文章:

  • IPSec小结
  • SAP 中关闭库存期间(MM 物料账期)核心是用MMPV关闭旧期间并打开新期间,配合MMRV控制前期过账权限,同时需完成 FI/CO 等关联模块期间控制与数据校验
  • nodejs+vue电动车租赁平台系统_9jmey8a6
  • Java小白求职面试:从Spring Boot到微服务架构的技术探讨
  • 混合精度训练:FP16与FP32, 借助Tensor Core加速
  • LangChain表达式语言
  • 8MP 环视 / DMS 摄像头,带宽到底有多狠?
  • 【Halcon-2D测量】get_metrology_object_fuzzy_param 函数功能(用于读取计量对象模糊测量参数)
  • 银河距离银河距离银河距离银河距离银河距离
  • 生成式深度学习(用变分自编码器生成图像)
  • 显示器分辨率?【图文详解】显示器分辨率调整?电脑分辨率设置?
  • 基于STM32的智能鞋柜系统设计与实现
  • VBA会被Python代替吗
  • python与nodejs哪个性能高
  • 【含文档+PPT+源码】基于小程序的智能停车管理系统设计与开发
  • Doris的自增列介绍
  • C++编程实践——多线程变量共享问题展开分析
  • 【Android FrameWork】第三十六天:随机数EntropyMixer
  • 介观交通流仿真软件:VISSIM (介观模式)_(16).高级仿真技术
  • 安卓 之 PassthruPatchRecord
  • YOLOv8 训练与检测系统智慧化交通公路上落石检测数据集 智慧道路交通路面障碍物检测数据集 智慧交通、山区公路监控、应急预警平台 YOLOv8 训练与检测系统
  • 基于django智慧农业管理系统设计开发实现
  • Android架构师面试指南:基于跨越速运职位要求的全面解析与参考答案
  • 【2025最新】基于SpringBoot+Vue的企业项目管理系统管理系统源码+MyBatis+MySQL
  • 企业级大学生考勤系统管理系统源码|SpringBoot+Vue+MyBatis架构+MySQL数据库【完整版】
  • 【2025最新】基于SpringBoot+Vue的物资综合管理系统管理系统源码+MyBatis+MySQL
  • 数学梗图数据集分析报告:999张高质量数学主题幽默图片资源
  • 【毕业设计】SpringBoot+Vue+MySQL 美食信息推荐系统平台源码+数据库+论文+部署文档
  • AI核心知识59——大语言模型之Mamba(简洁且通俗易懂版)
  • SpringBoot+Vue 流浪动物救助平台平台完整项目源码+SQL脚本+接口文档【Java Web毕设】