前言
一、写作动机
自从2006年深度学习三巨头之一的Geoffrey Hinton及其学生提出了采用“逐层初始化”(Layer-wise Pre-training)训练深度神经网络模型之后,新一波以深度神经网络为基础核心理论的人工智能席卷全球,以无比耀眼的姿态登上了全世界学术与工业实践的前沿舞台。自此,短短十几年的时间内,由深度学习推动的机器视觉、自然语言处理、语音识别等人工智能领域获得突飞猛进的发展,不断刷新识别、预测、生成等性能的历史记录。同时,深度学习所助推的自动驾驶、智慧城市、智慧家居、智慧物联、城市计算等新概念、新实践层出不穷,一时间“乱花渐欲迷人眼”。拥有千亿级参数规模的自然语言处理模型GPT-3涉足艺术领域,作出的诗歌能够以假乱真,让人不禁怀疑人类还有什么不能被AI所取代;AlphaGO通过“左右手互搏式”训练,实力碾压围棋九段世界高手李世石,令很多英雄黯然失色、俯首称臣;AlphaFold成功破解蛋白质结构预测50年未解之难题,再次问鼎自然科学之巅;等等。这些不断颠覆着人们的固有认知,让我们真正目睹了人工智能时代的来临,以及以其为代表的第四次工业革命的汹涌浪潮。
就在以深度学习为理论核心的人工智能汹涌袭来之际,道路交通领域的先驱研究学者们,也适时地将这门方法论引入了自己的研究领域,先后在传统道路交通所涉及的诸多领域开展了相应的研究,例如,基于深度学习的微观交通状态建模、基于深度学习的交通控制、基于深度学习的交通预测等,试图将传统的道路交通问题研究与最新的深度学习理论进行深度融合,充分释放当前交通大数据的内在价值,从而系统提升道路交通规划、管理、控制、诱导等多个层面的理论研究与工业实践水平。
在这样的时代大背景下,本书的写作动机可以总结为以下3个方面:
(1)短期交通状态时空序列预测是很多道路交通实践问题的核心理论,扮演着理论基石的作用。长期交通预测(如经典的四阶段法)可以服务于交通系统规划,而短期交通预测则是交通管理、控制、诱导等智能交通系统应用的基础与前提。本书所阐述的道路交通时空序列预测问题本质上属于短期交通预测。鉴于短期交通预测在道路交通领域的核心和基础地位,长期以来其一直是学术界研究中的重要问题。
(2)深度学习方法论的引入,为道路短期交通状态预测的研究带来了“质”的飞跃。纵观道路交通预测领域研究的发展历史,每次新的预测方法论产生之后,都会催生该领域大量的研究实践和创新成果。总体而言,时间序列类模型、卡尔曼滤波类模型、传统机器学习类模型及当前的深度学习类模型先后被引入该领域的研究之中,而依据当前基于深度学习的道路交通预测研究文献的公开结果来看,其预测性能相对于前几代预测方法有了极大的提升,这标志着道路交通预测的性能正发生着“质”的飞跃。
(3)探讨深度学习方法论与道路短期交通状态预测的研究问题的结合,不仅有助于提高道路短期交通状态预测的研究与实践水平,同时对于在道路交通领域传播深度学习这个具有时代标志性的方法论也具有十分重要的价值。深度学习属于机器学习领域,是典型的计算机科学分支,这对于道路交通专业的学生使用其进行本领域的研究造成了不少障碍,当前该领域的学者很多出身于计算机、电子信息等相关学科,也正是由于这个原因。但正如前文所说,深度学习是属于这个时代的方法论,不应该局限于某些计算机相关专业,道路交通专业的学生同样有必要掌握该门方法论,在理解它的基本原理的基础上,有效地运用它解决本领域的实践问题。本书的一个重要考量便是在介绍采用深度学习解决道路交通预测问题的同时,补充介绍一些深度学习的重要知识点,力求让非计算机类专业的学生也能够理解它的基本原理,并能够有效地使用它。
尽管最早基于深度学习的道路短期交通状态时空序列预测研究出现在2015年前后,但目前该领域的研究炙手可热,在领域内的顶级刊物发表了大量的研究文献。针对道路短期交通状态时空序列预测中复杂时空相关性的建模这一核心挑战,研究者分别借用了卷积神经网络(及其变形)、循环神经网络(及其变形)、注意力机制、Transformer等一系列深度学习前沿理论和方法,针对特定预测问题,提出了各自的建模思路,产生了一批新颖的创新研究成果。本书试图从这些前沿研究中选取出一些有代表性的成果,基于对它们的细致解读,从中提炼出基本的研究思路和建模技巧,试图阐明当前基于深度学习进行道路短期交通状态时空序列预测的优势和不足,从而对未来该领域的研究提供有价值的参考。
总结起来,从一个研究者的视角,梳理前沿,提炼规律,发现问题,看清趋势,传播知识,就是本书写作的全部初衷。
二、本书内容
本书系统地阐述了深度学习方法论在道路短期交通状态时空序列预测领域的最新研究成果。需要着重说明以下几点:①领域限定在了道路交通,因为交通是个大系统,存在空运、水运、陆运等多种运输方式,而本书所阐述的研究均是针对道路交通领域的数据,以及面向道路交通领域的应用;②本书所讨论的研究问题是道路短期交通状态时空序列预测问题,该问题是时空数据挖掘领域中时空预测问题的一个重要子集,在本书的第1章中将会对这个问题进行数学上的形式化定义;③本书针对道路短期交通状态时空序列预测问题的讨论,完全是基于深度学习的方法论,所参考的文献大部分发表于2017年以后,并不涵盖前人对该研究问题所采用的全部方法论(如ARIMA、卡尔曼滤波、SVR等)。
本书的内容组织安排总体上分为4个部分:①第1章从短期交通状态时空序列预测问题的一般数学形式化表达出发,揭示了该问题的本质及关键的核心挑战,并按照预测方式的不同对其进行了不同维度的分类,最后对该领域的相关研究进行了简要的文献综述;②第1篇(第2章~第4章)着重探讨基于深度学习的网格化道路交通状态时空序列预测问题,通过将研究区域网格化处理,进而将交通状态观测数据类比为图像(Image),从而采用深度学习领域的图卷积操作对其空间相关性进行捕获,进一步结合时间维度的卷积操作或者循环神经网络操作,对交通状态数据的时空相关性进行捕获,从而达到对未来短期交通状态的预测;③第2篇(第5章~第8章)探讨了基于深度学习的拓扑化道路交通状态时空序列预测问题。相对于将研究区域进行网格的划分,拓扑化更加自然地反映了研究区域内道路交通状态传播的底层物理规律,通过拓扑图卷积神经网络、注意力机制等实现道路交通状态的空间相关性捕获,进一步通过时间维度的卷积网络、注意力机制、循环网络提取交通状态的时空相关性,从而对未来拓扑网络的交通状态进行预测;④第3篇为第1、2篇中所用到的深度学习相关理论的概要性介绍,主要是为了方便读者快速且深入地了解相关的深度学习理论,降低读者将深度学习用于短期交通状态预测的门槛。尽管是“概要性”,但这些理论的介绍融入了很多作者的个人理解,力图深入浅出,直达问题本质,让读者快速掌握深度学习相关方法论。
三、本书特色
概括起来,这本书具有以下4个方面的特色。
(1)写作风格上严谨与通俗并重。一般的学术研究著作与研究论文措辞非常严谨,学术性较强,难免有“八股文”之风,所以学术著作常常给人以晦涩、枯燥、难以理解的直觉印象,这也体现了科学研究追求客观真理、不添加个人情感、无偏见的本质要求。但是这种客观、严肃的表达带给人的可读性、亲和力就略显不足。本书本质上属于学术专著,是在探讨严肃的科学研究,免不了大量的数学公式、复杂的逻辑推理,但同时本书还有一部分传播深度学习方法论的初衷,因此,在有些介绍方法论的部分,尽量采用了通俗的表达方式,以期让读者更容易接受和了解深度学习方法论复杂数学公式背后的动机和原理。
(2)写作思路上细节与宏观并重。本书从当前最新的研究中,选取一些具有代表性的研究文献,深入剖析其针对道路短期交通状态时空序列预测建模的整体构思、框架和公式细节,但在适当的时候,本书会对不同研究的建模思路、框架、模型处理技巧之间做出对比分析,让读者跳出数学模型的细节,在宏观上总揽全局,明确不同研究思路各自的思考角度、优缺点等。
(3)写作内容上问题与方法并重。本书本质上是学术专著与方法论教材的综合体,一方面,按照学术专著的写作思路,以道路短期交通状态时空序列预测问题为中心,介绍基于深度学习的不同研究思路;另一方面,按照教材的写作思路,以深度学习方法论为中心,为读者补充研究中所使用的方法论的基础背景知识。
(4)写作选材上前沿与多源并重。本书的写作选材全部来自行业内的顶刊(如IEEE Intelligent Transport Systems、Transportation Research Part C:Emerging Technologies、IET Intelligent Transport Systems等)自2017年后发表的最新研究文献,确保在选材上具有前沿性。同时,鉴于当前时代研究成果发表渠道的多元化,本书还参考了大量来自Arxiv的最新研究文献。此外,本书还参考了包括计算机科学、电子电气科学等领域顶级期刊的最新研究文献。
四、适用对象
本书适用于具有一定计算机科学(尤其是机器学习、深度学习相关理论)背景知识的道路交通领域专业研究人员阅读,也适用于时空数据挖掘领域的研究人员阅读。