前言
近年来,围绕大规模异构超级计算机在生命科学与医药领域的推广应用,我们团队与中国科学院上海药物研究所、军事医学科学院、深圳华大基因股份有限公司、电子科技大学、人和未来生物科技(长沙)有限公司、湖南智超医疗科技有限公司等单位密切合作,在生物医药大数据领域做了一些研究和开发工作。这些工作大多面向大规模异构超级计算机,解决海量数据分析的时效性和准确性问题。
由于大数据、机器学习等领域的专业书籍汗牛充栋,本书在对大数据并行计算、大数据的机器学习基础知识作简要介绍的基础上,重点介绍我们在生物医药大数据领域的最新研究工作,包括基因表达谱分析、微生物基因组、药物虚拟筛选、肿瘤基因表达谱分类、RNA编辑位点识别、增强子识别等。希望能够通过本书,帮助读者学习、理解、体会在大数据、超级计算、生物医药等交叉领域进行研究的基本方法和思路,从而达到“授人以渔”的目的。
本书是我们团队多年来努力创新的结晶,感谢国防科技大学计算机学院,感谢廖湘科院士,卢宇彤、刘杰、李姗姗老师,感谢团队中对本书内容做出贡献的崔英博、杨顺云、谢湘成、郭润鑫、董懂、张志强、程乾等同学。还要特别感谢与我们密切合作的中国科学院上海药物研究所蒋华良院士,朱维良、徐志建老师;军事医学科学院李松院士,童贻刚、伯晓晨、钟武、李非、舒文杰老师;电子科技大学邹权老师;湖南大学谭蔚泓院士、李肯立老师;中国科学院生物物理研究所陈润生院士等。
书中涉及的研究案例得到了国家超级计算长沙中心(湖南大学)在计算、大数据平台和研发方面的支持,也得到了相关单位、项目和基金的支持,其中包括国家重点研发计划2017YFB0202602、2018YFC0910405、2017YFC1311003、2016YFC1302500、2016YFB0200400、2017YFB0202104,国家自然科学基金U19A2067、61772543、U1435222、61625202、61272056,湖南省杰出青年基金2020JJ2009,长沙市科技计划项目kq2004010、JZ20195242029、JH20199142034、Z202069420652,鹏城实验室、化学生物传感与计量学国家重点实验室基金等,作者一并致以诚挚的谢意。
由于作者水平和精力有限,书中难免有错误和疏漏,恳请读者不吝指正。
作者
于长沙