subtitle
计算机视觉与深度学习-Transformer-【北邮鲁鹏】 计算机视觉与深度学习-Transformer-【北邮鲁鹏】
原文发布于 CSDN:https://blog.csdn.net/m0_49683806/article/details/133277528 引入相对于传统的 LSTM,Transformer 模型在处理长序列时具有更高的训练效率。这是
计算机视觉与深度学习-循环神经网络与注意力机制-Attention(注意力机制)-【北邮鲁鹏】 计算机视觉与深度学习-循环神经网络与注意力机制-Attention(注意力机制)-【北邮鲁鹏】
原文发布于 CSDN:https://blog.csdn.net/m0_49683806/article/details/133200309 序列到序列学习:输入和输出都是长度不同的序列 引出Attention传统的机器翻译是,将“机器
计算机视觉与深度学习-全连接神经网络-训练过程-模型正则与超参数调优- [北邮鲁鹏] 计算机视觉与深度学习-全连接神经网络-训练过程-模型正则与超参数调优- [北邮鲁鹏]
原文发布于 CSDN:https://blog.csdn.net/m0_49683806/article/details/132888637 神经网络中的超参数超参数 网络结构:隐层神经元个数,网络层数,非线性单元选择等 优化相关:学
计算机视觉与深度学习-全连接神经网络-训练过程-欠拟合、过拟合和Dropout- [北邮鲁鹏] 计算机视觉与深度学习-全连接神经网络-训练过程-欠拟合、过拟合和Dropout- [北邮鲁鹏]
原文发布于 CSDN:https://blog.csdn.net/m0_49683806/article/details/132872542 机器学习的根本问题 机器学习的根本问题是优化与泛化问题。 优化:是指调节模型以在训练数据上
计算机视觉与深度学习-全连接神经网络-训练过程-批归一化- [北邮鲁鹏] 计算机视觉与深度学习-全连接神经网络-训练过程-批归一化- [北邮鲁鹏]
原文发布于 CSDN:https://blog.csdn.net/m0_49683806/article/details/132870559 思想 直接对神经元的输出进行批归一化 批归一化:对输出值进行归一化,将归一化结果平移缩放
计算机视觉与深度学习-全连接神经网络-训练过程-权值初始化- [北邮鲁鹏] 计算机视觉与深度学习-全连接神经网络-训练过程-权值初始化- [北邮鲁鹏]
原文发布于 CSDN:https://blog.csdn.net/m0_49683806/article/details/132862247 思想 通过调整权值的分布使得输出与输入具有相同的分布 避免全零初始化 全零初始化:网络
计算机视觉与深度学习-全连接神经网络-激活函数- [北邮鲁鹏] 计算机视觉与深度学习-全连接神经网络-激活函数- [北邮鲁鹏]
原文发布于 CSDN:https://blog.csdn.net/m0_49683806/article/details/132862900 基础知识 激活函数是神经网络中的一种非线性函数,它作为神经元的输出函数,将输入信号进行转换
计算机视觉与深度学习-全连接神经网络-详解梯度下降从BGD到ADAM - [北邮鲁鹏] 计算机视觉与深度学习-全连接神经网络-详解梯度下降从BGD到ADAM - [北邮鲁鹏]
原文发布于 CSDN:https://blog.csdn.net/m0_49683806/article/details/132845945 参考文章及视频耿直哥讲AI:https://www.bilibili.com/video/