单位文秘网 2021-08-04 08:11:13 点击: 次
摘要:医学信息资源既是患者诊疗的重要依据,又是研究发病机制和规律的重要参考。然而,目前对大部分的医学数据仍缺乏后期加工处理,不利于临床的利用。本文通过发展现状研究,利用数据挖掘直观易懂、类似临床循证思维的优势,分析其用于肿瘤鉴别诊断的可行性。
关键词:数据挖掘;肿瘤鉴别;循证医学;诊断金标准
1数据挖掘的发展现状
1.1研究背景 计算机技术的飞速发展,医院信息系统积累了海量数据,涵盖了患者的病史、诊断、检查和治疗的临床信息、药品管理信息、医疗财务信息和医院管理信息。这些信息资源既是医生对患者正确诊疗的重要依据,又是医院管理层进行科学决策的重要参考,对促进人类健康,提高生活质量有重要作用[1]。然而,目前大部分医院对医学信息的处理仍停留在数据的录入、修改、查询、统计阶段,属于低层操作,缺乏对数据的后处理和分析,形成了"医学数据丰富而医学信息贫乏"的尴尬局面[2]。
1.2医学数据挖掘的应用 基于数据库、机器学习和医学统计学的医学数据挖掘应运而生,为医务管理人员以及科研工作者处理、分析和利用这些数据对医院进行科学管理、提高诊疗效果、开展学术研究等提供了技术支持。数据挖掘(Data Mining,DM)是从大量不完全的、有噪声的、模糊的、非结构化的数据中提取隐含在其中的、不为人们所知的、却又有潜在价值的信息和知识的过程,能智能分析数据,进行归纳性推理,挖掘出潜在的模式和规律,大大地提高了信息的利用率[3]。
目前,数据挖掘技术在医学的多个领域也有了一定的研究基础:
1.2.1 医疗诊断决策 在疾病诊断和预测中,通过对患者大量的数据资料的分析处理,挖掘出有价值的诊断规则,建立模型,再对此模型进行测试,得到合适的算法模型,利用该模型可以辅助临床医学诊断。例如,利用粗糙集算法对数据进行客观有效的处理,可迅速获得知识,在医学上采用各种数据挖掘方法对肺癌进行诊断对比[4];使用神经网络与决策树分别预测乳腺癌的转移发生率。
1.2.2 生物医学领域 DNA序列的研究是生物医学的热点,找出导致各种疾病的特定基因序列模式成为关注的焦点,数据挖掘中的序列模式分析和相似检索技术成为了DNA分析的有力工具[5]。支持向量机算法的计算复杂性与数据维度不成正比,只与样本数有关,分类的准确率较高。其在医学领域起步较晚,可用于生物学基因的分类、蛋白质二级的识别和预测细胞水平分布[6]等。
1.2.3 医学图像处理 数据挖掘应用于医学图像分析是其在医学中的一个重要应用,它能从海量的图像数据中挖掘出有效的模型、关联、规则、变化、不规则以及普遍的规律,给医师提供参考,提高诊断的准确度。
1.2.4 药理学研究 在药学研究中, 数据挖掘可以有效地存储、管理、分析及整合大量的不同类型的生物和化学数据, 已成为国际上新药研制过程中的关键技术支撑平台。如应用贝叶斯神经网络找出服用精神病药物与心肌炎和心肌病发病的关系[7]。
1.2.5 医院和卫生事业管理 运用数据挖掘技术,对医院信息系统(Hospital Information System,HIS)产生的大量信息资源进行加工,可得到长期、系统、综合的数据。通过决策树、神经网络、聚类等方法,对数据进行深层次的挖掘和有效利用,得到丰富的决策信息[8]。
2肿瘤的鉴别诊断
当今世界,恶性肿瘤已逐渐成为导致人类死亡的第一大病因。循证医学(Evidence-Based Medicine,EBM)给肿瘤学科的发展带来了深刻变革[9]。EBM是运用最新、最有力的科研信息,指导临床医师采用最适宜的诊断方法、最精确的预后估计和最安全有效的治疗方法来治疗患者。EBM的研究过程首先是研究数据的采集;其次是建立在科学详尽的数据采集基础上的科学定量分析,从而得出可靠结论;最后在系统评价的基础上编写临床指引,形成针对某一特定疾病的临床诊疗规范。EBM在肿瘤的病因研究、普查、治疗中都有应用。
3数据挖掘用于肿瘤鉴别的可行性分析
目前,鉴别肿瘤的金标准仍然是患者的病理结果(包括肿瘤的类型、形态学、分期、分级、免疫组化、遗传基因等),任何正确的肿瘤诊断都必须建立在准确的病理检查基础上。然而,病理组织标本需要经过手术或操作切除病损来获取,从标本取材到最终得出病理结论往往需要1w或更长的时间,耽误诊疗时机。因此,医学专家考虑在无创的情况下,依据肿瘤EBM的思想,通过对患者的病理结果以外的其他信息如性别、年龄、是否有吸烟史、是否存在职业暴露,以及专科检查、影像检查、验单结果等,来确定患者的疾病性质(如是否肿瘤、肿瘤的良恶性)、肿瘤类型(病理组织形态)、病变程度(肿瘤的分期分级)等。
3.1方法 利用数据挖掘算法建立肿瘤鉴别分析系统,对输入系统的多个因素(如患者性别、年龄、吸烟史、职业暴露情况、医学辅助检查结果)进行分析,通过概率判断肿瘤的性质;通过数据挖掘模型的构建过程计算各个影响因子的权重,从而探讨各种危险因素与肿瘤形成的关系。
3.2 研究意义
3.2.1 排除由于医学数据多样性造成的干扰。在临床诊断中,患者的生物学特征、遗传基因、肿瘤的病理形态、生活习惯与职业、对药物的敏感性、治疗效果等存在多样性,同一类疾病的患者其临床表型可能相差较大。数据挖掘算法综合了分类学习与回归分析的优势,通过生成树、剪枝处理过程,改善每个观察病例的异构性。
3.2.2 为后续治疗及临床研究提供重要参考。在不进行病理活检手术的情况下,通过对潜在肿瘤患者其他医疗信息的鉴别分析,协助临床医师判断肿瘤性质、类型以及程度,缩短诊断等待时间,减少患者的创伤,降低诊疗费用;以EBM为依据,结合临床知识库,为临床诊断、患者后续治疗提供了参考依据,为肿瘤的诱发因素、发病机制和规律的研究提供数据支持。
4结论
医学数据挖掘能克服传统数学分析方法的不足,很好地适应不同类型的数据结构,直观地呈现结果,与临床诊断思维相似。利用数据挖掘模型建立肿瘤鉴别分析系统,对输入系统的多个肿瘤指标进行分析,协助医生判断肿瘤的性质;通过计算指标的权重,探讨各种危险因素与肿瘤形成的关系,使分析结果更具权威性。
参考文献:
[1]刘爱民,马家润,鲁杨.病案信息学[M].北京:人民卫生出版社,2009:5-7.
[2]O"Neil P,O"Neil E著.周敖英,俞荣华,季问赟等译.数据库原理、编程与性能(第二版)[M].北京:机械工业出版社,2004:1-4.
[3]杨海青.数据挖掘技术在医院管理中的应用[J].中华医院管理杂志,2005,21(7):497-499.
[4]Kusiak A,Kern J,Kernstine K,et al.Autonomous decision-making:a data mining approach.IEEE transactions on information technology in biomedicine,2000,4(4):274.
[5]龚著琳,陈瑛,苏懿,等.数据挖掘在生物医学数据分析中的应用[J].上海交通大学学报,2010,30(11):1420-1423.
[6]Hua S,Sun Z.A novel method of protein secondary structure prediction with high segment overlap measure:support vector machine app roach[J].J Mo l Bio l,2001,308(2):397.
[7]Coulter D,Bate A,Meyboom R,et al.Antipsychotic drugs and heart muscle disorder in international pharmacovigilance:data mining study[J].BMJ,2001,322(7296):1207.
[8]左翔,刘方,胡学钢.医学数据挖掘的探究与应用[J].中国农村卫生事业管理,2011,31(3):268-270.
[9]王宁,王雅杰.在肿瘤学科教学中运用循证医学原理指引实践的思考[J].西北医学教育,2011,19(1):164-166.
编辑/孙杰
(责任编辑:单位文秘网) )地址:https://www.kgf8887.com/show-138-79914-1.html
下一篇:临床细菌检验的正确分析
版权声明:
本站由单位文秘网原创策划制作,欢迎订阅或转载,但请注明出处。违者必究。单位文秘网独家运营 版权所有 未经许可不得转载使用