上QQ阅读APP看书,第一时间看更新
3.1 什么是回归
回归通常是人们在机器学习中用到的首个算法。它使我们能够从数据中学习给定的一组因变量和自变量的关系来进行预测。它几乎使用在每个领域,对描绘两个或多个事物间关系感兴趣的任何地方都可以用到回归。
以估算房屋价格为例。影响房价的可能因素有很多:房间数量、建筑面积、位置、周围的便利设施、停车位等。回归分析可以帮助我们找到这些因素与房价之间的数学关系。
让我们想象一个相对简单的世界,其中房价仅由房屋面积决定。通过回归,我们可以确定房屋面积(自变量:这类变量不依赖于其他任何变量)与房价(因变量:这类变量依赖于一个或多个自变量)之间的关系。随后,我们可以使用这种关系来预测任何给定房屋面积的房屋价格。在机器学习中,通常自变量是模型输入,因变量是模型输出。
根据自变量的数量、因变量的数量以及关系类型,有许多不同的回归类型。回归有两个重要组成部分:自变量和因变量之间的关系,以及不同自变量对因变量的影响强度。下面我们将详细了解广泛使用的线性回归技术。