序一
与计算机视觉的结缘,源于我中学时期观看的由史蒂文·斯皮尔伯格执导的电影《人工智能》。该电影讲述了一个被赋予情感的小机器人渴望母爱、找寻自我、探索人性的故事。在那个还无法深刻理解“无论科技如何发达,爱才是宇宙之中的终极答案”的年龄,电影更吸引我的是:小机器人看到的世界是怎样的?看到了这些事物又是如何思考的?如何能够区分不同的物体,以及它们的形状、大小、是否在移动?
中学时期的好奇心驱使我从事了人工智能领域相关的工作,并在计算机视觉中找到了上述问题的答案。作为人工智能的一个分支,计算机视觉使计算机和系统能够从数字图像、视频与其他视觉输入中获取有意义的信息,并根据这些信息采取行动或提出建议。如果说人工智能使计算机能够思考,那么计算机视觉使计算机能够看到、观察和理解。得益于近年来深度学习、神经网络和计算机硬件相关技术的创新,计算机视觉在众多领域飞跃发展,在商业、农业、娱乐、交通、医疗保健等行业中扮演着重要的角色。例如,自动驾驶汽车通过摄像头和其他传感器的视觉输入,利用计算机视觉技术识别其他汽车、交通标志、道路标记、行人、自行车及在道路上可能遇到的所有其他视觉信息,理解这些信息并做出正确的反应或提示;在医疗行业中,Microsoft的InnerEye可以帮助外科医生从肿瘤的3D图像中准确地识别肿瘤的位置和轮廓,并在不伤害重要器官的前提下,直接针对肿瘤进行放射性治疗。
随着计算机视觉技术的高速发展,相关应用市场规模迎来了爆发式的增长,2022年全球计算机视觉和硬件市场规模预计将达到486亿美元,未来3~5年内中国计算机视觉人才缺口每年都在10万人以上,并且有逐年递增的趋势。因此,众多科研工作者和互联网企业都在该领域进行了布局、深耕,市面上也出现了一系列相关书籍,它们大多从原理出发,追本溯源地讲解计算机视觉的相关技术。虽然这些书籍清晰地阐述了计算机视觉的基础理论和底层逻辑,但大多包含大量的数学公式推导和模型算法解析,忽略了实战案例、实验操作的呈现,而强大的实战技能恰恰是众多互联网公司和数字化转型中的实体企业对计算机视觉工程师的基本要求。
在这样的大背景下,《计算机视觉应用与实战》应运而生!本书基于计算机视觉和机器学习软件库OpenCV,以及达内时代科技集团自主研发的AIX-EBoard人工智能实验平台,结合农业、医学、工业等领域的20多个案例,深入浅出地讲解不同计算机视觉相关模型和算法的基本原理,并针对案例详细地描述了实现方法。书中的每个案例均可作为独立的章节呈现,读者可以根据实际需求,依照提供的实验方法和代码,针对感兴趣的章节反复学习、实践和拓展。作为“人工智能应用与实战系列”教材的第一本书,本书由达内时代科技集团人工智能研究院诸多专家学者和工程师共同编写,基于公司在IT职业培训领域近20年的深厚积累,以及服务累计超20万家企业、1200所高校及100万名学生的丰富经验,旨在帮助读者快速成为符合企业实际需求的计算机视觉工程师和实战型人才,为中国人工智能产业的腾飞贡献一分力量!
郑政 博士
达内时代科技集团技术研发副总裁、人工智能研究院院长
2022年1月于北京