更新时间:2024-11-14 15:57:49
封面
版权页
内容提要
作者简介
前言
读者对象
套书特色
本书组织结构
资源与支持
第1章 欢迎来到深度学习的世界
1.1 什么是深度学习
1.2 主要核心模型
1.3 研究和应用领域
1.4 使用的技术栈
第2章 必要的数学预备知识
2.1 线性代数
2.2 微积分
2.3 概率统计
第3章 环境安装和工具使用
3.1 配置深度学习环境
3.2 conda实用命令
3.3 Jupyter Notebook快速上手
3.4 安装深度学习框架PyTorch
第4章 深度神经网络:误差倒查分解
4.1 神经网络原理
4.2 多层感知机
4.3 前向传播和反向传播
4.4 多层感知机代码实现
4.5 回归问题
4.6 分类问题
第5章 常见挑战及对策:一切为了泛化能力
5.1 训练问题分析
5.2 过拟合欠拟合应对策略
5.3 正则化
5.4 Dropout方法及代码实现
5.5 梯度消失和梯度爆炸
5.6 模型文件的读写
第6章 梯度下降算法及变体:高效求解模型参数
6.1 为什么要学最优化
6.2 损失函数及其性质
6.3 梯度下降算法
6.4 梯度下降算法的各种变体
6.5 梯度下降算法代码实现
6.6 学习率调节器
第7章 基础卷积神经网络:图像处理利器
7.1 为什么要用卷积神经网络
7.2 图像卷积
7.3 卷积层
7.4 卷积层常见操作
7.5 池化层
7.6 卷积神经网络代码实现
第8章 基础循环神经网络:为序列数据而生
8.1 序列建模
8.2 文本数据预处理
8.3 循环神经网络
8.4 RNN的反向传播
8.5 时间序列数据预测
8.6 编解码器思想及Seq2Seq模型
8.7 Seq2Seq模型代码实现
第9章 注意力神经网络:赋予模型认知能力
9.1 注意力机制的原理
9.2 复杂注意力机制
9.3 注意力池化及代码实现
9.4 Transformer模型
9.5 Transformer模型的代码实现