・20・ 现代医院管理2015年8月第13卷第4期Modem Hospital Management,Aug.2015,vo1.13,No.4 探索与研究 大数据时代生物医学决策支持模型的创新 汪陈应,李佳,邬小军 (中国人民后勤学院卫勤教研室,北京市100858) 【摘要】 大数据已成为生物医学行业研究的热点。笔者以生物医学中的大数据为切入点,提出并 对比分析了大数据背景下三类生物医学决策支持模型,最后阐述了生物医学决策支持面临的三大挑战, 即生物医学数据隐私保护与大数据共享要求高的矛盾,生物医学数据的特殊性与大数据处理能力不足 的矛盾,医疗机构狭隘的数据保护与大数据平台要求的矛盾。 【关键词】 大数据;生物医学;决策支持 【中图分类号】 R197 【文献标识码】 B 【文章编号】 1672—4232(2015)04—0020—03 【D0I编码】 10.3969/j.issn.1672—4232.2015.04.006 大数据已经成为当前各界关注的焦点…。通常, 域疾病防控、区域医疗服务等相关的健康信息。首先, 电子健康档案记录的是人或者一个区域长时期的健康 数据,具有持续时间长、大量增长的特点;其次,由于电 大数据是指无法在可容忍的时间内,用现有信息技术 和软硬件工具对其进行感知、获取、管理、处理和服务 的数据集合。近年来,随着基因的一代测序、二代测 序、各种医学成像技术等的发展,大大加速了生物医学 领域数据的产生,给生物医学领域的决策支持模型带 来了新的挑战。 1生物医学中的大数据 子健康档案采集的卫生机构和健康状况检测设备的差 异,导致档案数据格式复杂,很难集成融合;第三,随着 时间的推移和医学的发展,导致常规检测指标和参考 标准发生变化,从而造成健康档案数据模式也不断更 新完善。电子健康档案的特点对数据存储、共享、查询 和分析效率都提出了更高的要求。 1.4 生物医学事业快速发展产生了生物医学文献大 数据 1.1 第二代DNA测序技术产生了碱基序列大数据 第二代DNA测序技术也叫新一代测序、高通量测 序,可以一次对几十万到几百万条DNA分子进行序列 测定,每小时能够完成数以亿计的DNA碱基序列的测 序,产生约10TB(1TB=10 B)的数据。而目前亟待 生物医学事业发展的标志是生物医学涉及的学科 增多,分支也越来越多,生物医学知识也随之剧增。据 解决的问题在于,测序仪产生的海量数据没有与之相 适应的有效的二代测序结果分析工具和数据管理系 统,这给科研人员和二代测序技术的普及造成了障碍。 1.2 医学成像技术产生了医学影像大数据 随着CT成像、磁共振成像、超声成像、核医学成 像等技术的发展,医院诊疗工作越来越依赖于现代化 的检查检验结果,随之而来的是医学影像数据的海量 统计,互联网中的信息资源超过30%是生物医学信 息;全球生物医学类刊物近3万种,每年发表论文200 多万篇,并以7%的速度递增。另外,生物医学信息是 医学界知识更新的主要来源和重要工具。这就对生物 医学信息存储和检索效率提出了较高的要求。 2大数据时代的生物医学决策支持模型 在总结现有理论和方法的基础上,充分考虑大数 据环境所带来的管理方法创新,提出生物医学领域三 类研究方法的决策支持模型,如图1。 增长。尤其是医学影像存储于传输系统(PACS)的发 展与广泛应用,各大医院的各类医学影像数据已经向 PB(1PB=1015B)级迈进。另外,医学影像数据的复 杂性、异构性和保存周期长等特点,对当前的数据管理 和分析系统都提出了巨大的挑战。 1.3健康管理系统产生了电子健康档案大数据 传统的卫生统计方法是将数理统计的原理和方法 应用到卫生领域,通过设计、收集、整理和分析,获得可 靠结果的过程;数据挖掘方法是对大量观察到的数据 进行分析,以便从中发现事先未知的联系和规律的过 程;大数据研究方法旨在从海量复杂数据中抽取知识 和观点。 健康管理从服务对象的层次分为:面向社区的健 康管理和面向个人的健康管理。与之相对应,电子健 康档案也区分为社区电子健康档案和个人电子健康档 案。两者的关系是:个人电子健康档案是基础,包含个 人所有的健康信息;社区电子健康档案是汇总,是与区 卫生统计决策支持模型与其他两类模型的显著差 异:一是数据尺度的差异。卫生统计是依据决策的精 度决定样本含量,通常是几十到几百个体;而数据挖掘 现代医院管理2015年8月第13卷第4期ModemHospitalManagement,Aug.2015,vo1.13,No.4 ・21・ 经常会面对MB至GB级的数据库,大数据方法处理 结构化的表,半结构化的网页,非结构化的文字、图片、 音视频等。四是数据分析的理论、方法及工具不尽相 同。卫生统计基于的理论和方法是假设检验、关联性 的数据量更大,会达到TB至PB级。二是数据获取的 差异。卫生统计处理的数据往往是针对特定的问题而 采集的数据,在采集数据之前一般有严谨的设计,然后 分析数据解决特定的问题,属于本位分析;而数据挖掘 和大数据所使用的数据原本就存在的,可能是为了其 他目的而采集的,是属于数据分析的次级过程。三是 分析、回归分析等统计学方法,数据处理工具是成熟的 也较为简单的电子表格、SAS、SPSS等工具;数据挖掘 基于的理论和方法是聚类分析、分类分析、关联规则分 析等数据挖掘与知识发现理论和方法,数据处理工具 是数据库管理系统等大型数据处理软件;而大数据处 理的理论和方法是自然语言处理、离群点分析、知识推 理等理论和方法,数据处理的技术是云存储和云计算 等新兴技术 。 大数据方法 —数据形态的差异。卫生统计处理的数据是完全结构化 的数据,而数据挖掘可以处理结构化和半结构化数据, 基于HL7标准的医疗文书数据挖掘就是半结构化数 据;大数据方法处理的数据更是多态而且更新迅速,有 卫生统计方法 —数据挖掘方法 —--( 决策支持目标)_一 1.药物效验证 2.致病因素分析 3.平均水平预测 4.・・--・・ __( 决策支持目标)_一 1.住院患者聚类 2.冠心病分类 3.院内感染监控 4.・…・・ __( 数据获取与整理)一 1.数据自组织 2.动态实时数据 3.结构化、半结构化、非结构 化数据;4.…… l —l —I —一_( 数据获取与整理 卜 1.严谨的实验设计 2.从总体中抽取样本 3.数据整理与审核 4.结构化数据 -.( 数据获取与整理 卜 1.收集整理数据 2.数据情况 3.结构化、半结构化数据 4・・ ・・・ ._( 分析理论与方法 卜 1.自然语言处理 2.离群点分析与监测 3.知识推理与预警 4.・…・・ l —I —l —_( 分析理论与方法卜一 1.假设检验理论 2.关联性分析 3.回归分析 4.--・・・・ __( 分析理论与方法 卜 1.聚类分析 2.分类分析 3.关联规则分析 4.・・・・・・ __( 处理工具与技术)一 I.云存储与云计算 2.大数据可视化技术 3.流媒体技术 4.・・・・-・ l —l —l ——__( 处理工具与技术)一 1.电子表格 2.SAS 3 SPSS 4.…… __( 处理工具与技术)一 1.数据库管理系统 2.数据仓库系统 3.数据挖掘工具 4.・・・-・・ ( 决策支持目标)_一 1.传染病监测 2.智慧健康管理 3.影像大数据分析 4.・・・・・・ l l l ( 决策支持 ) ( 决策支持 ) ( 决策支持 ) 图1 三类生物医学决策支持模型对比 除了上述差异外,大数据决策支持模型与其他 两类模型还有一个显著的差异,即大数据方法通常 据研究的基本要求。大数据研究课题是否能够取得 成功与患者参与程度有密切关系,然而随着生物医 是数据驱动型决策,而其他两类方法通常是目标驱 动型决策。所谓目标驱动型决策是指决策者首先要 明确决策支持的目标,即先明确“干什么”,然后研 究“怎么干”,一般是通过数据采集加工与分析计算 等步骤,对数据中的有效信息进行提取和分析,从而 达到对态势评估,趋势预测等目的。所谓数据驱动型 决策是侧重于训练机器的组织和学习能力,能够响应 数据的动态变化,发现海量数据中的“离群点”,并深 入推演分析“离群点”形成的背景和原因,从而最终达 到监测、预警并积极处理突发事件的目标。 3大数据时代生物医学决策支持面临的挑战 3.1 生物医学数据隐私保护与大数据共享要求高矛 盾突出 一学数据的采集、加工和应用,数据泄露时有发生,进 而带来医学数据隐私的泄露;另一方面,随着患者对 个人隐私保护意识增强,科研人员必须告知患者大 数据研究可能给他们及其后代带来的利益与风险, 并尽可能找到保护患者隐私的办法,以获得患者的 信任与参与。 3.2 生物医学数据的特殊性与大数据处理能力不足 矛盾突出 除了大数据海量、异变、多态的基本特征外,生 物医学大数据还具有:一是时序性,数据会随着时间 推移而不断演绎;二是异构性,由于研究对象复杂、 试验人员差异、仪器设备差异,造成生物医学数据异 构性非常大;三是要求高,对于作为判断患者病情发 生发展重要依据的生物医学数据 (下转第80页) 方面,开源和高度数据共享是生物医学大数 ・80・ 现代医院管理2015年8月第13卷第4期Modem Hospital Management,Aug.2015,vo1.13,No.4 2讨论 圈活动前后采用自制的评分表,对每位圈员进行能力 测评,内容包括解决问题能力、责任心、沟通协调、自信 心、团队凝聚力、积极性、品管手法掌握程度、个人素 养,结果显示,圈员各方面能力均有大幅度的提升。 3小结 2.1 缩短医保患者平均住院日具有重要意义 实施医保总额预付制后,医院面临医保经办机构、 医保患者的双重压力,如何平衡不断增长的服务需要 和费用控制的管理需要,是医疗机构要重点关注的问 题 。而平均住院El是评价医院工作效率和效益、医 品管圈活动是建立在PDCA循环基础上的一种推 动Ft常工作质量持续改进的有效工作,是作为对传统 自上而下管理模式的有力补充。通过对缩短医保患者 疗质量和技术水平的综合指标,有效缩短医保患者平 均住院日,不但能够减轻医保患者负担,在总额相对固 定的情况下,还可以扩大医保的收容量,提高床位利用 率,提高社会效益和经济效益。 2.2品管圈活动能有效缩短医保患者平均住院日 通过品管圈活动的开展,圈员查验中发现的瓶颈 平均住院日的积极尝试,今后可以在医院的医保管理 工作中开展更多的品管圈活动,让医保各细项工作螺 旋式递进,向标准化、规范化、科学化发展,更符合医改 发革与医院发展需要。 参考文 献 制约问题,如临床医生医保不熟悉、对工作效率认 识不够全面、医保患者手术等候时间长、医技科室预约 等候及出报告时间长、没有建立良好的双向转诊通道 [1] 陈琳.林梅,茅建华,等.医保定额结算方式对平均住院日的影 响[J],东南国防医药,2014,16(1):6o一61. [2] 肖谦,廖碧玉.品管圈在医疗收费管理中的应用[J].医 院管理杂志,2014,(10):983—985. 等问题,都制定了相应对策并实施。实施半年以来,品 管圈活动取得明显成效,医保患者住院时间延迟率下 降至21.33%,降低了25.67个百分点。而且2014年 上半年医保患者平均住院日也由原来的12.88天缩短 至12.32天,管理手段发挥了良好效应。 2.3品管圈活动可提升医保专管人员综合素质 [3]张蘅,闰冰.总额预付改革下精细化医保住院指标的实施[J]. 中国医院管理,2012,32(6):42—44. 通信作者:廖碧玉(1981一),女,经济师,本科;研究方向:医 院成本核算。 收稿日期:2015—06—08 (编辑曹晓芸) 品管圈活动从选定主题到问题解析,提高了医保 专管人员自主学习、主动分析的能力;拟定、实施对策, 体现收费人员的解决问题能力和团队协作精神;活动 效果分析,增强了收费人员的自信心和责任感。品管 (上接第21页)处理,准确性、保存周期、更新频率都提 出了很高的要求。生物医学的这些特性,对大数据的 收集、存储、传输、分析等处理能力都提出了挑战。 3.3 医疗机构狭隘的数据保护与大数据平台要求矛 盾突出 一参考文 献 [1]李国杰,程学旗.大数据研究:未来科技及经济社会发展的重 大战略领域:大数据的研究现状及思考[J].中国科学院院刊, 2012,27(6):647—657. 方面,在大数据时代下,尤其是数据驱动型的生 [2]杨帅,胡宗倩,伯晓晨,等.云计算在生物医学中的应用[J].中 国科学:生命科学,2013,43(7):569—578. 物医学决策,根本在于数据的拥有,可以说谁拥有大数 据,谁就有制胜的砝码,谁就能成为大赢家 ;而另一 方面,由于利益及风险等原因,生物医学科研部门及医 疗机构对于各自拥有的生物医学数据都持保护态度, 不愿意向社会和同行提供数据服务,各机构所积累的 海量数据基本还处于“孤岛”状态,这对于形成生物医 [3] 甘丽新,涂伟.大数据时代电子商务的机遇与挑战探讨[J].科 技广场,2013,(3):137—140. 通信作者:邬小军(1967一),男,博士,副教授;研究方向:卫 生勤务。 收稿日期:2015—05—04 (编辑马兰) 学大数据平台,提高研究效率都造成了极大的障碍。