单位文秘网 2021-08-23 09:32:36 点击: 次
[摘要] 在医学领域,病例是极具价值的知识源。基于案例的知识发现是数据挖掘领域新的研究方向,但现在的电子病例是以文本数据形式表示,其内涵语义信息无法用计算机处理,难以实现自动知识获取。此外,由于电子病例尚没有标准化数据格式,不同的管理信息系统不能实现共享和互换操作。本文对以上问题作了分析,并提出相应的解决思路。
[关键词] 医学信息学;KDC;循证医学
[中图分类号]R19 [文献标识码]C [文章编号]1673-7210(2007)08(a)-164-02
现代信息技术的迅速发展,给医学领域带来了重大革新。21世纪,电子病历(CPR, computer-based patient records)将是医院信息系统(HIS)的核心和临床信息工具,已成为目前医院信息系统发展的重要目标之一。在此基础上建立医学案例库,通过计算机智能信息处理技术自动提取归纳大量病例中蕴含的规律,使其成为临床知识的来源和临床决策依据,是医学信息学和循证医学发展的基础和必由之路。
1 医学信息学的发展现状及需求
医学信息学(medical informatics)是一门快速增长的交叉学科,它研究如何存储、检索、共享及有效利用为解决问题和决策所必需的生物医学信息、数据和知识,近年来在国际上日益受到重视[1]。目前研究较多的是医学文献资料的共享和检索,如美国在政府资助下建立海量医学文献数据库,制定统一规范的医学术语,推动数据规范化,便于用户高效查找所需信息。在医疗机构内部,由于发达国家在20世纪70~80年代就基本实现信息化管理,HIS系统已普遍应用,现在的主要工作是数据的标准化和信息系统的集成化,以实现对医疗、科研和教育的全面支持以及不同医疗机构之间的数据共享。国内医学信息学发展较晚,以医学文献资料检索为主[2]。近来亦得到医学界的重视,已有眼科信息学等专业领域的研究[3]。近年来知识的重要性被普遍认识,医学信息学的发展方向是医学知识管理和医学知识的自动获取已成为共识。目前医学知识管理的研究主流是采用ontology、RDF、XML等技术对医学文献资料进行语义标记,以实现自动分类和智能化检索,医学知识自动获取则侧重于通过KDD技术对生物医学方面的试验数据进行挖掘。但要指出的是,这些工作对临床医疗的支持远远不足,原因在于忽视了临床医学的经验性和复杂性。临床医学的经验性决定了医疗案例是极具指导价值的知识来源,基于病例库的知识发现必然会成为医学信息学的重要研究领域。目前相关领域的研究国内外都较为缺乏,已有的研究工作存在下述缺陷:虽然电子病历是文本格式记录,其语义信息难以计算机处理;案例用研究者自己选定的一组参数表示,不能表达病例的时域特征和语义结构;也缺少对复杂案例数据挖掘算法的研究;缺乏对基于例库的知识管理系统的研究。因此病例的语义表示、病例库管理及面向病例库的知识发现、基于病例库的知识管理研究对于医学信息学的发展具有重要意义和实用价值。
2 循证医学的发展及需求
循证医学是近年来临床医学极力推广的医疗模式,强调应用获得的最佳临床研究证据,但当前循证医学所采用的信息技术主要是临床资料数据库管理和检索,而文献中的临床研究通常在实验设计时屏蔽了患者的个体化差异,且倾向于报道阳性结果,并不能保证实际治疗的有效性[4]。通过对大量实际病例建立病例库,用计算机技术智能化对病例库进行统计、分析和知识挖掘,可以避免目前循证医学所面临的上述问题,其结果可作为有效的临床证据。
3 基于案例库的知识发现的研究瓶颈
基于案例库的知识发现(KDC)所面向的是结构复杂、知识丰富、有时域变化的案例,目前KDC的研究国内开展的较晚,尚缺少系统性的研究。国外KDC的研究亦属于起步阶段,试验案例不能体现KDC的复杂性[5]。
综上所述,医学案例信息丰富、结构复杂,其描述目前仍以自然语言为主,用目前的关系数据库技术对其进行管理,难以使医学病例库成为临床医生的知识来源及临床决策的依据,难以实现数据资源和知识资源的共享。为此,我们归纳出了该领域的主要问题,并提出相应的解决思路。
3.1 面向形式语义的病例表示方法的研究
病例表示方法应具有通用性和形式化特征,适合计算机处理。要能够表达患者的病理、生理参数与诊断、治疗措施之间的语义关系,能够表达病例中各概念间的时序逻辑语义和治疗过程的时序性特征,能够表达疗效评价。我们认为可以采用本体(ontology)作为病例表示方法的理论基础,国际上正在开发建立的统一医学语言系统(UMLS),便于实现计算机处理,人工智能领域中的语义网络知识表示方法适用于表示医学本体,并可通过对语义网络加入量化和时序标记进行扩展。以上方法结合起来,可以实现病例的计算机语义处理。
3.2 病例库的构建及管理
卫生部正在着手制定电子病例的数据格式标准,医学病例的数据结构要易于实现与其他电子病例系统间的数据格式转换,实现互操作性。但目前数据的存储、维护和检索需要在关系数据库上进行,为此要解决从病例库的逻辑结构到关系数据库的映射。可以通过对时序标记的分割映射为一组二维网状结构;采用类似于构造演绎数据库的方法,使其能表达二维结构,这样就可以实现从三维逻辑结构到一维关系的形式化转换。互操作性可以通过本体映射实现,目前已经有较多这方面的研究成果。
3.3 病例库上的知识发现算法研究
为了从医学案例库中抽取具有临床决策价值的知识,应重点研究以下知识发现算法:模式聚类算法,量化的关联规则发现算法,差异分析算法,离群模式发现算法。对于医学病例而言,病例结构复杂,需要降维以提高算法效率,维度过低又有可能线性不可分,对病例信息的维度处理是一个难点。在知识的监督下进行知识发现可以降低挖掘算法的盲目性,我们认为,病例表示的拓扑结构中蕴含了较多的知识信息,可以将其提取出来作为挖掘算法的控制机制,将挖掘算法改造为有监督的机器学习算法,提高算法效率。
[参考文献]
[1]崔雷.Medical Informatics概念和历史[J].医学情报工作,2004,25(4):241-244.
[2]董建成.医学信息学的现状与未来[J].中华医院管理杂志,2004,20(4):232-235.
[3]王晓幸,王勤美.眼科信息学的发展概述[J].中华眼科杂志,2006,42(5):476-480.
[4]陈臻,郭小健.循证医学在眼科临床实践中的应用[J].医学与哲学,2005,26(10):41-42.
[5]倪志伟,蔡庆生,贾瑞玉.范例库上的知识发现[J]. 南开大学学报,2002,25(4):45-49.
(收稿日期:2007-06-30)
(责任编辑:单位文秘网) )地址:https://www.kgf8887.com/show-125-87460-1.html
版权声明:
本站由单位文秘网原创策划制作,欢迎订阅或转载,但请注明出处。违者必究。单位文秘网独家运营 版权所有 未经许可不得转载使用