生物医药大数据与智能分析
上QQ阅读APP看书,第一时间看更新

1.1 生物医药大数据

大数据,通常指无法在一定时间范围内用常规软件工具进行采集、管理和处理的数据集合。通常来说,大数据需要具备“4V”特征,即数量(Volume)大、产生速度(Velocity)快、多样性(Variety)高和价值(Value)高[4]

由于生物医药领域需求的推动和大数据技术的不断发展,大数据已经从研发、制造、医疗服务等环节进入生物医药产业链,生物医药大数据得到了快速发展,尤其在以下3个方面。

(1)生命的整体性和疾病的复杂性导致病因学研究需要海量的生物医药数据作为支撑。例如,人类生命体具有复杂的遗传和分子机制,通过海量的相关数据透视这些机制,能够揭示其中隐藏的生命科学规律,为病因和治疗研究提供支撑。

(2)高通量测序技术的发展和基因组测序成本的下降为基因大数据的产生提供了条件。高通量测序技术可以对数百万个DNA进行同时测序,使得对一个物种的转录组和基因组进行细致、全面的分析成为可能。随着人类基因组计划的完成和计算能力的快速提高,每个基因组的测序成本已从数百万美元降低至数千美元,并且还将继续降低,已经产生了海量测序数据[5-8]

(3)IT行业和医院信息化的迅速发展,也在推动医学图像等诊疗数据源源不断地生成。随着医学仪器的不断进步,越来越多的医疗设备产出了大量人体数据,医院信息化的不断进步,也使得这些数据的存储和共享更加高效和方便。