机器学习算法评估实战
上QQ阅读APP看书,第一时间看更新

前言/PREFACE写作这本书的背景

这是充满机遇的时代,也是充满挑战的时代;这是技术日新月异的时代,也是我们回归正统、找回真我的时代;这是互联网产业蓬勃发展的时代,也是互联网技术不断转型、不断创新的时代。

很多人都听说过互联网浪潮[1]的“下半场”。那么,什么是“下半场”?为什么互联网产业的发展会分为“上、下半场”?

首先,我们来说一说“上半场”都发生了什么。

过去的十年中,在人工智能技术和互联网思维的驱动下,做网购的天猫和京东、做餐饮的美团、做打车的滴滴、做租房的自如……这些互联网公司如雨后春笋般迅猛发展,公司业务几乎涵盖了人们衣食住行的方方面面。

但是,这些公司基本上不做实体产业,他们只是把线下的产品或服务通过互联网平台呈现在消费者面前,在商品或服务的提供商和消费者之间提供连接的纽带,这就是互联网思维。在这种运营模式背景下,这些公司需要对海量的数据进行分析和计算,以便更好地为商户或消费者服务。对于大数据处理这种数据量大、重复性高的工作,如果将其交给人来完成无疑是成本高昂且效率低下的,因此,机器学习技术也就成了完成这项工作的“不二之选”。

在互联网浪潮的“上半场”中,机器学习在各公司的业务实践中初露锋芒。从天猫的商品个性化推荐,到百度的语义识别,再到京东的无人配送,机器学习都发挥了不可替代的作用。机器学习的评估体系也承担了重要的任务,人们通过一些常规的指标,基本能够完成对算法质量的初步判断,从而使算法在应用中达到预期的效果。

然而,在互联网浪潮的“下半场”中,竞争逐渐激烈、市场趋于稳定,许多公司已经有了属于自己的一片“领地”。对于大公司,“下半场”更多地意味着“精耕细作”和“国际化”,“精耕细作”指进一步提升效率和降低成本,“国际化”则指将平台和世界接轨,真正将自己的品牌推向世界。而对于后入场的小公司,则意味着两条发展路线,一条是研发领先于市场的新技术和新产品,做尖端服务,这可能难度较大;另一条就是走精细化路线,专注于某一个垂直领域,也就是大公司的业务涵盖不到的业务场景,提供差异化服务。

无论是大公司还是小公司,在“下半场”的竞争中,对机器学习算法的研发都需要更加专业化和精细化。在机器学习算法评估的问题上,传统领域的很多指标不一定能适应新的领域,因此在新的领域中需要新的评估指标来提供特定业务场景下的个性化服务。而对于职场上的个体,掌握一套科学高效的评估理论,不仅可以大大提高自己的工作效率,也能更好地向上级领导展示自己的工作成果,在职场发展中取得事半功倍的效果。