破解深度学习（基础篇）：模型算法与实现

瞿炜李力杨洁

更新时间：2024-11-14 15:57:49

最新章节：9.5 Transformer模型的代码实现

封面

版权页

内容提要

作者简介

前言

读者对象

套书特色

本书组织结构

资源与支持

第1章欢迎来到深度学习的世界

1.1 什么是深度学习

1.2 主要核心模型

1.3 研究和应用领域

1.4 使用的技术栈

第2章必要的数学预备知识

2.1 线性代数

2.2 微积分

2.3 概率统计

第3章环境安装和工具使用

3.1 配置深度学习环境

3.2 conda实用命令

3.3 Jupyter Notebook快速上手

3.4 安装深度学习框架PyTorch

第4章深度神经网络：误差倒查分解

4.1 神经网络原理

4.2 多层感知机

4.3 前向传播和反向传播

4.4 多层感知机代码实现

4.5 回归问题

4.6 分类问题

第5章常见挑战及对策：一切为了泛化能力

5.1 训练问题分析

5.2 过拟合欠拟合应对策略

5.3 正则化

5.4 Dropout方法及代码实现

5.5 梯度消失和梯度爆炸

5.6 模型文件的读写

第6章梯度下降算法及变体：高效求解模型参数

6.1 为什么要学最优化

6.2 损失函数及其性质

6.3 梯度下降算法

6.4 梯度下降算法的各种变体

6.5 梯度下降算法代码实现

6.6 学习率调节器

第7章基础卷积神经网络：图像处理利器

7.1 为什么要用卷积神经网络

7.2 图像卷积

7.3 卷积层

7.4 卷积层常见操作

7.5 池化层

7.6 卷积神经网络代码实现

第8章基础循环神经网络：为序列数据而生

8.1 序列建模

8.2 文本数据预处理

8.3 循环神经网络

8.4 RNN的反向传播

8.5 时间序列数据预测

8.6 编解码器思想及Seq2Seq模型

8.7 Seq2Seq模型代码实现

第9章注意力神经网络：赋予模型认知能力

9.1 注意力机制的原理

9.2 复杂注意力机制

9.3 注意力池化及代码实现

9.4 Transformer模型

9.5 Transformer模型的代码实现

更新时间：2024-11-14 15:57:49