推荐序三
决策无处不在。没有什么比事实更好,当我们要做出决策时,如果有事实可以依赖,往往会根据事实做决策。从事实(原始数据)到影响因素(特征数据)再到决策(信息、结论),我们有众多的工具可用,其中人工智能和机器学习方法是目前学术界和产业界正在如火如荼地研究和实践的领域。然而,在所有的机器学习算法中,决策树应该是“最友好”的了。它的整个运行机制具有良好的可解释性和人类模仿性。人类可以在可接受的时间内,采用输入数据和决策树模型参数,经过每个计算步骤,得到预测结果。这种模型特性更容易获得人类的信任,而且有助于通过正反馈不断改进该模型。
目前人工智能应用已经渗透到生活的方方面面,成为我们生活中重要的一部分。未来有望产生一个能够感知、学习、做出决策和采取独立行动的自主系统。但是,如果这些系统无法向人类解释为何做出这样的决策,那么它们的有效性将会受到限制。人类要想理解、信任和管理这些智慧的“合作伙伴”,可解释性和模仿性至关重要。正是这种强需求让传统决策树方法焕发新生机,特别是回归任务催生的一些应用,使得深度学习模型与梯度提升决策树模型形成了有机的结合,使决策树算法和模型的研究进入了新的阶段。周志华教授等提出的深度森林,将集成学习方法与决策树模型相结合,示范了另一种深度模型的构建方法。决策树模型在未来人工智能的创新发展中具有重要的地位。
本书从经典决策树入手,介绍了核心的原理和机制,从公式推导、实例演算到代码实现,以易于理解且可实践的方式呈现了决策树的方方面面。特别是详细介绍了各类新的决策树模型及其工程化优化原理,包括并行决策树、蚁群决策树以及多种深度决策树。
本书对决策树的实践应用具有重要价值,特别是对于那些对数据科学和人工智能感兴趣的人来说,这是了解决策树模型的一本很棒的参考书。
肖利民
博士,教授,博士生导师
北京航空航天大学计算机科学技术系主任
计算机系统结构研究所所长