1.3 生物医药大数据的智能分析
近年来,人工智能的浪潮正在席卷全球,“人工智能”这个已有60多年历史的概念重新得到了人们的热切关注。1956年,几位计算机科学家相聚在达特茅斯会议,提出了“人工智能”的概念,梦想着用当时刚刚出现的计算机来构造复杂的、拥有与人类智慧同样本质特性的机器。之后的几十年里,人们对人工智能的研究和应用一直在疯狂追捧和全盘否定中摇摆前进,直到近10年间,由于深度学习理论在生物医药等多个重要领域取得重大进展,人工智能才又一次得到了全球学术界和产业界的广泛关注。
人工智能是一个相当宽泛的研究领域,涉及许多研究分支,包括机器学习、专家系统、进化计算、模糊逻辑、计算机视觉、自然语言处理等。机器学习作为人工智能的一个研究分支,其最基本的做法是通过一定的算法对大量数据进行训练,得到一个模型,然后用该模型完成任务。这些算法通常包括聚类、决策树、贝叶斯分类、支持向量机、Adaboost等。经过几十年的发展,机器学习在指纹识别、人脸检测、物体检测等任务中都达到了实用化的水平,但在更多的领域却难以得到满意的结果。近年来,作为以神经网络为基础的机器学习方法,深度学习的理论和实践都得到了突破,在许多领域取得了令人惊异的进展,相比传统的机器学习算法形成了明显的优势,也激起了人们对人工智能光明前景的期待。
实际上,生物医药大数据现在和未来的成功应用与机器学习有着密不可分的关系,而深度学习的成功很大程度上得益于大数据技术的发展。生物医药与人工智能结合的关键在于“算法+有效数据”。先进的机器学习算法能提升数据处理效率与识别准确率,而大量有效的数据则是先进算法应用的基础。2012年以后,正是得益于大数据技术的发展、计算能力的飞速提升和深度学习的出现,以深度学习为核心的机器学习技术在生物医药领域从科研到应用都取得了巨大的进展。特别是以卷积神经网络(Convolutional Neural Network,CNN)和循环神经网络(Recurrent Neural Network,RNN)为核心算法的深度学习技术,更是深刻影响了生物医药领域的现状,并将重塑其未来。