上QQ阅读APP看书,第一时间看更新
第四节 医院数据资源利用
一、医疗数据的概念、内容、特征和价值
(一)医疗数据的概念和内容
医院信息系统分为医院管理信息系统和临床信息系统,随着业务活动的开展和系统的运行,积累了大量宝贵的数据资源。
从业务领域的划分,医疗数据包含电子病历数据、医嘱数据、费用数据、检验检查数据、药品数据、耗材数据、医保数据、组学数据、随访数据、资源分配数据、管理绩效数据和健康管理数据等;从数据格式的不同,医疗数据包含结构化数据和非结构化数据,非结构化数据有文本数据、音频数据、视频数据、影像数据、图像数据、流数据等,目前被利用的较多的是结构化数据,而非结构化数据中涵盖的宝贵知识急待开发。
随着云计算的兴起、物联网的加入和精准医学的推动,医疗数据正以前所未有的速度积累和扩张,目前正迈入医疗大数据的时代。
(二)医疗数据涵盖的特征和价值
医疗数据资源具有数据规模庞大、数据增长快速、数据结构多样和价值密度多维、数据可信性要求高、数据安全社会关注度高等特性,这些特性正好符合大数据的5V特征:大容量(volume)、多样性(variety)、时效性(velocity)、准确性(veracity)、高价值(value)。
我国医疗信息化已有20年发展历史,初期的目标是事务管理和流程电子化,从基于模板的病历文档编辑器到以医嘱为核心的临床流程电子病历应用。到如今随着数据资源的积累和应用需求的不断升级,将数据通过深度挖掘转化为知识,是医院信息化发展的重要目标,基于知识库的智能医疗系统是电子病历应用的必然趋势。因此,对医疗数据资源进行挖掘分析,形成知识规则,服务于临床、科研和医院管理,是医疗数据资源利用的重大价值体现。
从临床科研角度看,医疗活动所产生的海量数据可支撑科研项目进行真实世界的探索,经挖掘分析形成的知识库可回馈于临床,进行疾病筛查、辅助诊断、治疗方案建议、风险预测和病情预报等,进一步对患者进行精准治疗。从管理角度看,对医疗数据的分析挖掘可支撑医院精细化管理,如进行患者量预测、住院时长分析等支撑运营精细化管理,通过质量指标后评价、病历相似度分析等支撑医疗质控精细化管理。
二、医疗数据的标准
医学信息标准化是指信息表达上的标准化,实质上就是在一定范围内人们能共同使用的,对医学领域内相关客体抽象的描述与表达。临床信息标准的建立就是为保证医学信息的有效传递、理解,以及互操作性,而其取决于语法、术语及语义三个层面。语法指通信的格式、结构及文法上应具有相同的结构,使不同系统或机构间的数据交换成为可能。术语是指在特定专业领域中,准确、一致地表达信息或概念,并对其提供特定编码的标准。术语中对各个概念及其概念间的逻辑关系描述则为语义,是用于传达通信的根本意义。如不具备语义上的互操作性,即使数据可以交换与共享,也无法保证接受者能正确理解及使用该数据。下面就主流医学信息学标准进行简要介绍。
(一)数据交换标准
数据交换标准是关于格式、数据元素、结构及文法的规范标准,使各个医疗机构在异构系统之间能够进行数据交互。
1.HL7(health level 7)是标准化的卫生信息传输协议,是一系列的标准,涉及信息交换、软件组件、文档与记录架构及医学逻辑等。HL7汇集了不同厂商用来设计应用软件之间的通信标准格式。
2.DICOM即医学数字成像和通信标准,其定义图像及其相关信息从图像设备的接口传入与传出,普遍用于PACS系统。
(二)术语标准
在医学领域,依据不同的开发策略及服务目的,建立了多套医学术语系统,具有代表性的有:国际医学术语标准化研发组织开发的系统化临床术语集(systematized nomenclature of medicine clinical terms,SNOMED CT),及美国国立医学图书馆开发的一体化医学语言系统(unified medical language system,UMLS)。
1.SNOMED CT的发展融合了多个术语系统,其目前已成为最广泛全面的临床词表,涵盖了临床医学的大多数方面。SNOMED CT作为世界上主要的标准临床术语集,由于其可灵活地对临床术语进行表示,能反映临床术语间的逻辑关系,并以关系数据表形式组织等优势,因此在世界上30多个国家的电子病历、电子处方、医嘱录入及决策支持系统中得到广泛应用。
2.UMLS是对生物医学领域内许多受控词表的一部纲目式汇编,其主要应用领域是生物医学信息检索、医学自然语言处理及临床决策支持等。UMLS的目的是建立一个整合的生物医学概念、术语、词汇及其等级范畴的集成系统,以便解决因各系统的差异性和信息资源的分散性所造成的检索困难。
3.临床实验室观察结果标识符名称与代码系统(LOINC)为实验室和临床检查、相关医嘱及检查结果提供了一套统一的名称和标识符,从语义和逻辑上支持医学检验、检查结果的交换。
4.国际疾病分类第十版(ICD-10)是国际上通用的,根据疾病特征按照一定规则将疾病分门别类,并用编码的方法来表示的系统。其广泛用于医院临床诊断的分类、检索与统计。
(三)文档标准
文档标准表明何种类型的信息包含在文档中的何处位置。HL7临床文档体系结构(HL7 CDA)是用于临床文档的标准交换模型,具有特别结构和语义的临床文本标准。其为电子病历系统的实现提供了标准。
(四)概念标准
概念标准是使数据在不同系统间传输而保持原意的准则。HL7参考信息模型(HL7 RIM)为描述临床数据及其背景提供了一个框架,它是所有HL7 V3协议规范标准最根本的来源。
三、医院数据集成平台建设
随着医院信息化水平的不断提升,各医院业务系统逐渐走向专科化、专业化,继而建立起较独立的信息平台与系统。随之而来是医院数据的日益庞杂及无序组织。使得数据标准化、各系统间的互操作性、医院及机构间的信息互联互通均面临极大的困难。
临床数据中心(CDR)是以数据应用为目的的数据组织方式,其以患者的基本信息作为主线,将患者在医院里的历次就诊信息串联起来,以供分析利用。其作为科研平台,本身以CDR作为数据源,通过Hadoop等大数据架构,以便捷的对海量数据进行查询与提取。临床数据中心围绕患者就诊,从HIS、LIS、PACS、RIS、PIS等业务系统的各个功能模块中采集人口学信息、诊疗信息与费用信息等,具体内容包括患者基本信息、入出转管理信息、症状与体征信息、检查信息、检验信息、治疗信息、处置信息、手术麻醉信息、影像信息、随访信息等,以及跨域获取和健康相关的外部环境数据、气象数据、体检数据等。根据采集来源不同,这些信息基本上可以划分为四大部分:
1.临床数据资源,以病案首页、电子病历信息和医嘱信息为核心的患者个人信息以及诊疗活动概要信息。
2.影像数据资源,以医学影像数据为核心的患者图像资料。
3.各种组学数据资源,主要包含人群基因组、蛋白组等组学数据。
4.科研随访数据资源,是以临床学会或临床医生构建的病种及随访报告表单为数据源。
临床数据中心的目的是高质量的整合数据,其有以下特点:
1.高度集成
通过建立统一数据接口或信息集成平台,系统将原有散在各系统的相关数据采集、清理、整合后放入CDR。
2.提升结构化、术语化水平
信息系统中包含文本、图片、影像、音视频等多种非结构化诊疗数据,必须通过各种识别技术,提高其结构化水平。在此基础上依据SNOMED CT等临床术语集,将结构化后的数据术语化,以应用其相关语义网络。
3.建立标准字典库
建立统一的人员、科室主数据及术语编码服务,实现院内字典、卫生部医疗标准、国际医疗标准的统一访问和应用。支持ICD-10疾病诊断字典、SNOMED CT临床术语集、支持XML输出标准、HL7接口标准等;以达成医院内部各系统以及外部各上报系统间数据交换时语义级别的标准化,平台应对交换数据中的字典数据做映射转换。
4.患者统一视图
建立患者唯一主索引(EMPI)以关联患者所有的诊疗相关信息,包括社会信息、过敏信息、家族病史、历次诊疗信息、检验检查信息、随访等诊疗及预后信息、历次电子病历、医嘱收费情况等,同时还可将相关的人员(如家属)的信息进行关联,便于关联分析家族病史与职业病成员的病史。通过患者唯一主索引的建立实现以患者为中心的角度,从时间维度、诊疗事件维度、主要疾病和健康问题维度等三个维度构成的立体视图,进行全生命周期的纵向临床记录浏览,关注患者的整体健康状况和临床信息。
5.构建临床CDR模型
基于HL7 V3 RIM并参考卫生部基于CDR的电子病历等相关标准,构建临床数据资源的数据模型,采用成熟的数据库技术及领域模型,实现业务数据的有机整合,并将其转变成各种有价值的信息,以帮助医院实现持续的质量改进和服务创新。
6.主题数据集及科研平台
在整合的临床数据库的基础上,逐步建立基于疾病、治疗、卫生经济、医生、患者等各方面的主题数据集,为医务人员提供完整、统一的数据展现及一体化科研平台。
四、基于数据集成平台的应用案例
(一)临床应用
1.临床诊断决策
传统的临床诊断中,医生凭借症状问询、个人实践、检验指标、图像解读进行判断,难免会存在质量与效率的问题。随着医疗领域信息化技术的飞速发展,疾病的诊断和治疗已经不完全由临床医师的个人经验所决定,而是需要有科学证据的支撑。医学知识工程和数据挖掘研究中的热门领域——CDSS(clinical decision support system)应运而生。
CDSS源于医学专家系统。早期的CDSS主要是通过模拟经验丰富的医学专家,依赖医学专家的经验总结和人工抽取整理形成医学知识。现代CDSS利用海量医疗数据不仅对现有医学知识进行验证,而且致力于发掘隐含的、未知的医学知识。通过对通过大数据分析研究所制定的临床决策系统CDSS,根据医疗知识和临床数据对病例进行分析,一方面为临床医生提供辅助决策支持,有效降低医学错误的发生率;另一方面简化诊断判断过程,提高诊疗效率。
世界上第一个功能较为全面的专家系统是MYCIN,1976年由美国斯坦福大学开发用于细菌感染病诊断的专家咨询系统,它通过于医生交流,获取患者的症状、病史以及各种检查结果,可在诊断治疗不齐全的情况下进行初步判断,给出诊断结果。随后,1982年美国匹兹堡大学发表了著名的Internist-I,一个用于内科疾病诊断的专家系统,其知识库中包含了570多种内科疾病,超过4 000多种症状。进入21世纪后,临床决策支持系统持续高速发展,同时融合人工智能、知识工程和计算机信息技术。近些年,国内也涌现出一大批基于数据挖掘的临床诊断决策系统。例如,利用关联规则挖掘方法,实现了恶性孤立性肺结节影响诊断规则的挖掘,通过对恶性鼓励性肺结节病例的CT图像挖掘得出810条诊断判断规则,验证了关联规则算法挖掘出来的诊断规则与临床公认的诊断规则是一致的。除此,数据挖掘中的决策表近似算法、基于时间的序列决策树模型等方法都已被运用到临床诊断决策系统中。
临床诊断决策支持系统已经成为大数据技术在医疗领域的重要应用。利用数据挖掘得出的医学知识能够有效提升疾病诊断的准确率,为患者带来更加优质的医疗服务;通过对决策过程、环节进行记录与分析能够为医疗行为监管、解决医疗纠纷、发现诊疗决策支持系统中存在的问题环节、完善诊疗决策支持系统的功能提供依据。
2.个性化治疗
2009年,《快公司》发表了一篇专题文章,题目名称为“未来的医生”,文章旁边的配图里,画的是一个医生提着一个黑色的医用大皮包,然而皮包上面连接着各种电源线,以及USB接口和电插座。医疗服务实现无线化后,数字采集技术与医学治疗技术相结合,能够持续跟踪患者在院内和院外的复杂生理指标,甚至一些数字成像指标。2011年,伊利诺伊大学的学者发表了一篇文章,讲到了他们在芯片文身方面的最新成果:他们发明了一种可以与皮肤直接结合的芯片,这种芯片具有很强伸缩性,只要安置在适当的肢体部位(胸、肌肉附近或者额头),就能捕捉到个体的心率和心律、血糖、肌肉活动,甚至脑电波。
以往患者和医生从未获得过的数据,现在每时每刻都从不同的数据采集端源源不断地出现在人们眼前。数据工程师将采集到的各种数据汇聚到人群健康管理系统中,个体的生物学信息、既往史、家族史、诊疗记录、健康体检结果能随时被有权限的医疗服务提供者所查看。药剂师在全面了解患者病情和个体信息后,可以针对病情开出更精准更个性化的处方;急诊出诊前医护人员就能提前看到患者当前的生理指标、既往的病史以及近期健康状况,针对出诊患者备好施救人会员、救护仪器和药材等。与此同时,面对面的问诊、开医嘱、看片工作量将大大减少,患者与数字化医生之间的虚拟互动将大幅增加。
(二)医学研究
1.指南研究
指南的目的是为了改善临床医疗水平。目前国内外,同一病种诊治方案各异,各学会不同,都不是十全十美。系统的结合当前所有的科学证据以及临床医师的诊疗经验,并且根据患者的实际状况形成临床有效可操作性的诊疗方案,不断改进原有的临床指南,让医疗水平不同的地方都能得到同质的医疗指导,改善全民医疗健康。大数据技术的发展为指南的研究提供了无限可能,医疗健康大数据覆盖许多国家或者地区、医院、卫生机构以及所有人群,通过医院、卫生机构、穿戴设备等所记录的诊疗过程、临床诊断、病程记录、医嘱信息、检验检查结果等都是患者的真实记录,蕴含着极高的价值,背后隐藏着人类未知的医学知识和待挖掘的指南信息。
2.医药研究
当代社会互联网技术飞速发展,可穿戴设备随处科见。除了医疗服务机构的医疗就诊信息,各种移动采集终端还可以收集到患者不同时期的生理水平、网络购药行为、网络医药咨询等数据。这些数据如果都被人群健康数据中心统一管理起来,那么患者可以随时随地查看自己的就诊信息、用药信息、诊疗结果。医疗机构也可以有效地掌握病情变化、侦查到微小的生理变化等,针对性地调整患者用药信息,在最适合的时间给患者使用最合适的药品,产生最优的治疗效果。同时,基础科研人员也能更充分地研究各种药物的作用机制、适应证、配伍禁忌等,使药物能够更精准的服务于各类人群。
3.管理决策
(1)支撑医院运营管理的数据应用系统:
对于医院管理来说,管理的中心是运营,运营的重点是决策,而决策分析的基础是准确的数据指标。医院运营决策分析有四个步骤:一是收集决策所需数据和指标,二是进行分析和预测,三是进行决策程序,四是决策计划实施PDCA。
针对医院运营管理常规决策需要,可将所需数据和指标进行梳理,形成医院医疗财务管理指标、医院资源管理和医院服务管理等医院运营管理所需的一系列指标,构建医院运营管理指标分析系统,从医院管理数据中心中抓取与运营管理相关的数据形成应用主题,嵌入分析、预测等统计模块和监控模块,支撑医院管理者基于真实数据的运营决策行为。
1)医院财务管理指标分析系统:
医院财务管理指标包括医院总收入、医院总支出、门诊收入、急诊收入、住院收入、药品收入、材料收入、治疗收入、药占比、材料占比、门诊患者人均费用、门诊患者药占比、出院患者人均费用、出院患者药占比、出院患者材料占比、出院患者每床日费用、门诊每诊费用等。
医院财务管理指标数据来源于医院收入分析主题和药品耗材使用分析主题。医院收入分析主题支撑医院管理者在患者来源、收入结构等方面的变化掌控,基于数据设定管理指标辅助医院控制药占比、材料占比;从开单科室、接收科室、费用时间、就诊类型、开单医生和执行人等角度分析收入等情况,通过医嘱数量计算科室和个人的工作量等;通过患者的费用信息归集监控门诊次均费用、门诊次均药费、出院次均费用的变化,以控制费用增长,减轻病患负担。药品耗材使用分析主题是为了建立药品、耗材的用量统计,促进药品、耗材的流通过程透明化,满足供应链的科学决策要求。
2)医院资源管理指标分析系统:
医院资源管理指标包括卫生技术人员数、医护比、管理人员数、工勤技能人员数、床位数、医师与床位数之比、耗材占比、护士人员数、医护之比、平均床位周转次数、病床使用率等。
医院资源管理指标数据来源于床位资源利用分析主题和人力资源分析主题。床位资源利用分析主题通过对床位数、床日数、床位费的理论值和实际值进行比较,提供床位数据异常情况的分析和预测。人力资源分析主题提供各类人力资源信息;针对护理人力,可通过护理医嘱的系数测算病房所需配置的理论护士数量,支撑护理部配置护理人力资源。
3)医院服务管理指标分析系统:
医院服务管理指标包括出院人次、门诊人次、急诊人次、手术台次、门诊预约人次、专家门诊人次、门诊开诊人次、门诊预约比例、每诊人次、出院患者平均住院日、手术患者术前等待日、出院患者占用总床日数、门诊患者外国外省外市人次比例、出院患者外国外省外市人次比例、门诊患者初诊人次、门诊患者复诊人次、门诊双向转诊转上人次、住院双向转诊转下人次、门诊入院证开具数量、急诊入院证开具数量、每百门急诊人次入院比例等。
医院服务管理指标数据来源于门诊就诊主题、住院就诊主题、急诊就诊主题、患者来源地分析主题和入院服务分析主题。门诊就诊主题是基于门诊业务的综合数据分析模块,对门诊就诊过程中从办卡、挂号、就诊、取药(检查)、开入院证等流程的分析管理。住院就诊分析主题从患者科室、专业组、患者费用、出院情况、患者病种、手术方式等多维度分析出院患者情况。急诊就诊分析主题需梳理现有急诊业务和急诊流程,形成满足急诊需要的工作量、收入构成、时间段等分析指标。患者来源地分析主题主要抓取系统中多处地址来源,利用文本挖掘技术处理非结构化内容,并探索优先级策略将多处地址内容聚合为一个可供统计分析的结构化地址。入院服务分析主题从患者病情急缓、医院资源使用的角度分析门急诊患者入院情况。
(2)支撑医疗业务质量管理的数据应用系统:
医疗业务质量管理是医院管理的核心内容和永恒主题,是医院管理活动的首要任务。医疗业务质量管理是不断完善、持续改进的过程,体现在医院的各项管理工作中,第一步是建立质控管理组织架构,明确职责,第二步是健全各类质控规章制度,第三步是建立切实可行的管理方案。
医疗业务质量指标分析系统的目标即是根据医院医疗业务质量管理相关要求,从医院管理数据中心中抓取与医疗质控相关的数据构建应用主题,形成手术安全管理、合理用药管理、重返监控、病历书写管理等系列指标,构建医疗质控管理知识库,支撑医疗质控部门监控医疗风险,从而保障全院各科的临床诊疗质量。
1)手术安全管理指标分析系统:
手术安全管理指标包括出院患者择期手术人次、出院患者急诊手术人次、出院患者围术期死亡人次、手术患者并发症发生人次、NNIS分级手术人次、无菌手术感染率、无菌手术甲级愈合率等。
手术安全管理指标分析系统整合病案首页数据、电子病历手术记录单数据、手术器械清点单数据和手术排程数据等,支撑医院质控管理者在手术并发症、手术危险分级和手术感染方面及时了解各科情况。
2)合理用药管理指标分析系统:
合理用药管理指标包括门诊处方数量、门诊处方金额、门诊单处方费用、门诊基药处方比例、门诊人均药嘱笔数、急诊处方数量、急诊处方金额、急诊单处方费用、出院患者抗菌药物使用强度、出院患者使用三线抗菌药物送检率、急诊静脉使用抗菌药物人次、抗菌药物使用品规数、出院患者使用抗菌药物比例等。
合理用药管理指标系统整合病案数据、处方数据和抗菌药物医嘱数据形成分析主题,就住院患者而言,可分析不同药理属性的抗菌药物消耗量、使用强度、患者使用抗菌药物占比,以及在抗菌药物使用前是否有微生物送检、I类手术预防使用抗菌药物比例及抗菌药物费用等;针对门急诊患者而言,可分析不同药理属性的抗菌药物消耗量、抗菌药品使用人次等;还可通过对处方量、处方金额的分析进行合理性处方点评。
3)重返监控管理指标分析系统:
重返监控管理指标包括出院患者当日非计划再入院人次、出院患者两周内非计划再入院人次、出院患者一月内非计划再入院人次、出院患者自动出院人次、手术患者非计划再次手术人次等。
重返监控管理指标分析系统整合病案数据和电子病历手术记录数据,可从重返医院和重返科室两个层级统计重返指标,通过钻取到病人明细进行非计划重返原因的进一步分析和挖掘,加强与临床沟通的及时性,以期降低医疗风险。
4)病历书写管理指标分析系统:
病历书写管理指标包括病程书写相似程度、诊断部位一致性程度等。
病历书写管理通过机器挖掘算法,提供病程相似度、治疗部位一致性等病历书写结果指标结果,为病历质控人员提供病历书写内容的监控和评价功能,降低医疗风险,减少医患纠纷。
(3)支撑医保管理的数据应用系统:
在我国医疗保险对患者覆盖范围越来越大的同时,对医院的医疗行为管控政策也越来越多。医保管控政策除了总额控制以外,还有单病种付费、特殊疾病管控以及智能规则审核扣款等措施,通过医保政策倒逼医院加强费用控制、减少不合理支出、有效利用资源。
在越发严格的监控体系下,医院必须加强自身管理,在规范医疗行为、减少医疗费用的同时,必须实时关注医保金额的使用情况和结余情况。医保数据综合管理分析系统整合医保患者基本信息、实发医嘱数据和经医保联网结算后返回医院的医保数据,以适应数据分析的模型存储数据。
医保数据综合管理分析系统将医保政策相关信息与医院实际医疗行为数据整合分析,构建合理控费的医保规则知识库,在医生诊疗过程中进行智能数据监测以及预警预测等,辅助医院医保控费管理。通过数据分析,一方面将赋予医保管理者实时监控医院-患者-医保经办机构各方状态的洞察力,另一方面也对四川大学华西医院医保管理工作起到流程优化和质量提升的实际意义。系统可从病种、科室和医保类型等角度分析不同的医保患者发生总费用中申请报销占比、自付占比和患者重返率等情况,可对总控指标进行管理,通过数据分析确定下年度(季度)合理的总控指标,并通过已发生费用情况,对可能存在的扣款风险进行控制。还可通过数据分析比较,辅助病种费用控制、辅助科室绩效指标设置与管理。