当前位置: 首页 > news >正文

全连接层(Fully Connected Layer)

全连接层(Fully Connected Layer,又称稠密层/Dense Layer)是神经网络中最基础且重要的组件之一,广泛应用于多层感知机(MLP)、卷积神经网络(CNN)和Transformer等架构中。以下是对全连接层的系统分析:
. 核心定义
结构特点:层中每个神经元与上一层的所有神经元相连,每个连接都有独立的权重参数。

数学表达:


2. 核心功能与原理
(1)特征空间变换
通过矩阵乘法将输入映射到新的特征空间,实现特征的组合与抽象。

示例:在图像分类中,CNN 末端的全连接层将卷积提取的局部特征整合为全局语义信息。

(2)非线性拟合能力
结合激活函数(如 ReLU)引入非线性,使网络能够逼近复杂函数(通用近似定理)。

(3)参数量与计算量
参数量:m×n+m(权重 + 偏置)

计算量:矩阵乘法复杂度 O(m×n),易成为计算瓶颈。

  1. 在全连接神经网络(MLP)中的角色
    通常多个全连接层堆叠,层间通过激活函数连接。

层级特征提取:浅层学习低级特征(如边缘),深层组合为高级抽象特征。

  1. 在CNN中的应用
    末端分类器:将卷积层输出的二维特征图展平为一维向量,通过全连接层映射到类别空间。
    1.基本使用
importtorchimporttorch.nnasnnimporttorch.nn.functionalasF# 1. 基本创建方式fc_layer=nn.Linear(in_features=784,out_features=256,bias=True)print(f"权重形状:{fc_layer.weight.shape}")# torch.Size([256, 784])print(f"偏置形状:{fc_layer.bias.shape}")# torch.Size([256])# 2. 前向传播示例batch_size=32input_tensor=torch.randn(batch_size,784)# [batch, features]output=fc_layer(input_tensor)# [batch, 256]print(f"输出形状:{output.shape}")

2 关键参数详解

classLinear(nn.Module):""" 参数说明: ---------- in_features : int 输入特征维度 out_features : int 输出特征维度 bias : bool, default=True 是否使用偏置项 device : torch.device, optional 计算设备 dtype : torch.dtype, optional 权重数据类型 """def__init__(self,in_features,out_features,bias=True):super().__init__()self.in_features=in_features self.out_features=out_features self.weight=nn.Parameter(torch.Tensor(out_features,in_features))ifbias:self.bias=nn.Parameter(torch.Tensor(out_features))else:self.register_parameter('bias',None)self.reset_parameters()
http://www.cnnetsun.cn/news/27063.html

相关文章:

  • RNN(循环神经网络)原理
  • 人机协同重构创作生态——生成式AI赋能内容产业的变革与思考
  • Java 小白求职者在互联网大厂的面试实录:从 Spring Boot 到微服务架构
  • V助手舆情分析智能体:重塑舆情分析,从“人找信息”到“信息为人”
  • 连接2026:十款远程控制软件真实力横评与选择指南
  • 计算机毕业设计springboot基于Spark++Vue.js的学生管理系统 Spark+Vue 高校学生综合信息管理平台 基于 SpringBoot+Spark+Vue 的全链路学生事务中心
  • JavaScript 集合操作的哈希碰撞:攻击者如何利用特殊 Key 导致 Map/Set 性能降级到 O(N)
  • 为什么 C盘空间会莫名其妙减少(即使没装新软件)?
  • 17、深入理解 Linux 文件系统机制与结构
  • 29、Linux 软件使用与故障排除指南
  • 从入门到转行:网络安全自学与跳槽的终极建议
  • 网络安全小白自学之路,别拜师了,求人不如求己_网络安全小白怎么自学
  • 从系统运维到网络安全工程师,8个月转行真实经验分享!
  • 算法系列(Algorithm)- 快速排序
  • RobotStudio2025全功能授权
  • IsaacLab中UR机械臂与Robotiq夹爪的5大配置难点与解决方案
  • cmark Markdown解析器终极指南:从入门到精通
  • 4-bit量化FLUX模型:让专业AI绘图走进寻常百姓家
  • Excel VBA快速入门:7天从零到精通终极指南
  • AutoHotkey鼠标轨迹自动化终极指南:从零开始实现精准操作回放
  • UxPlay 终极指南:在 Linux 系统上实现 AirPlay 镜像的完整教程
  • 1-2 惜败!国安亚冠连败 中超 16 强魔咒难破
  • 一键解锁阅读3.0书源终极合集:1629个精品资源任你选
  • 一般人不懂Windows
  • Java 基于多线程机制的专项实验
  • 51、Linux 系统中 shell 环境管理与脚本编写全解析
  • 53、编写高效 Shell 脚本:从基础到实践
  • 解锁共享单车数据:从入门到精通的完整分析指南
  • KOOM:如何快速解决Android应用内存泄漏的终极方案
  • API 测试- Postman Vs Rest Assured