跳跃连接:残差网络使用了跳跃连接,将输入与输出相加,将残差映射为恒等映射。这种设计可以使得网络更容易学习残差,从而加速收敛和提高性能。
残差块:残差网络的基本单元是残差块,每个残差块包含多个卷积层和跳跃连接。这种结构可以有效地学习不同层次的特征,并且降低了梯度消失的风险。
深度网络:残差网络可以构建非常深的网络,因为跳跃连接可以帮助梯度传播更容易地达到较深的层次,从而实现更好的性能。
非线性:残差网络中每个残差块都包含非线性激活函数,例如ReLU,用于增加网络的表达能力。
全局平均池化:在残差网络的末尾通常会使用全局平均池化层替代传统的全连接层,这可以减少参数数量,降低过拟合的风险,同时提高模型的泛化能力。