单位文秘网 2022-02-18 08:13:36 点击: 次
思想推导出标量形式和矩阵向量形式的权值迭代公式,最终通过求矩阵伪逆的方法直接计算出网络的最优连接权值,从而避免了传统BP算法冗长的迭代学习过程。在权值直接确定法的基础上,网络结构自确定算法能够自动确定出神经网络的最优结构。
2.2.1权值直接确定法
设网络输出层只有一个神经元,定义此网络的输出误差为
E=1N∑Nn=1(δn-yn)2(2)
其中,N为样本数,δn为第n个训练样本的目标/真实输出值,样本输出向量则为δ=[δ1,δ2,…,δN]T。记fn,m表示fm(xn),将隐含层的受激励输出写成矩阵形式为
F=f1,1f1,2f1,3…f1,M
f2,1f2,2f2,3…f2,M
····
fN,1fN,2fN,3…fN,M∈RN×M,(3)
可得
E=1N‖δ-Fw‖22(4)
依据最小二乘逼近原理和矩阵伪逆符号,令上式E等于零,便可直接求得最优权值向量
w=F+δ(5)
2.2.2网络结构自确定法
在神经网络结构的确定中,隐含层神经元数目的确定往往是个难题:过少的神经元会导致学习能力降低、误差较大;过多的神经元会导致网络的泛化能力变低[13]。通常而言,网络学习误差一开始会随着神经元数目的增加而降低;当神经元数目增加到一定规模时,网络学习误差会出现振荡,即在一个较小的范围内波动,难以继续下降。基于此现象,本文设定一个波动标准,当神经网络的波动超过此标准时,便认为前一状态的神经网络已处于最优,此时神经网络的数目为最佳。为实现此目的,本文采用边增边删的结构自确定法,逐个增加隐含层神经元的数目并进行训练,同时得到对应校验误差。当校验误差的波动超过制定标准时,便停止该算法。此算法的另一个特点是每当一个新隐含层神经元增加,若此时校验误差不降低,此神经元将会被自动删除,这样便有效地控制了神经元数目的快速上涨。
举例以高斯函数为隐含层激励函数的多变量RBF神经网络,针对其隐含层神经元数目的选取问题,首先在数据初始化的时候,以实际GFR值的大小作为标准对样本进行排序;然后以中心样本序号最大间距法的原则确定新的隐含层神经元中心(即,从样本两端出发,找寻相邻两中心样本序号之间的最大间距,并选取中间的样本作为新的中心)。图2便为网络结构自确定法的流程图。
3建模与实验
利用来自中山大学附属第三医院的医疗数据,建立起RBF神经网络模型并对其进行训练与测试,然后与传统估算肾小球滤过率方法及相关的神经网络进行比较。
3.1数据预处理与建模
国内外学者很早就发现人体内有几项生理指标与肾小球滤过率密切相关,如体重、年龄、性别、体表面积、血清肌酐、白蛋白和尿素氮。普遍流传的经验方程CockcroftGault(CG)方程和K/DOQI推荐的简化的MDRD方程(也称中国方程)就利用了上述的生理指标[15]。因此,本文将使用这7个指标作为输入变量对肾小球滤过率进行估算,其中体表面积由身高和体重计算得来。本文采用了2005年1月至2010年12月在中山大学附属第三医院就诊的1180例就诊病例,将其分为学习组、校验组(或称内部校验组)和测试组(或称外部校验组)[4]。其中,测试组数据不参与神经网络模型的建立过程,只用以评估模型的估算准确度。病例所收集并使用的项目包括患者的性别(S)、就诊当日的年龄(A)(岁)、体重(W)(kg)、身高(H)(cm)、血清肌酐(Scr)(mg/dL)(采用酶法测定)、白蛋白(Alb)(g/L),尿素氮(Bun)(用日本HITACHI公司7180型全自动生化分析仪测定)和患者的GFR[ml/min/(1.73m2)](采用TcDTPA肾动态显像法,使用美国GE公司双探头SPECT,配以低能通用准直器所测试)。
将学习组患者的7个生理指标作为7个输入变量,患者对应的GFR值作为目标输出,对RBF激励WASD神经网络进行训练;同时利用校验组的病人数据对神经网络的性能进行分析,调整神经网络的结构,构造出具有最优结构的RBF神经网络。然后,用测试组的患者数据进行估算,得出神经网络的肾小球滤过率的估算值(estimatedglomerularfiltratioate,eGFR)。与上述构造WASD神经网络的方法类似,根据平均影响值(meanimpactvalue,MIV)判定法[15],对7个输入变量的重要性进行排序,排序结果为Scr>Bun>S>W>A>Alb>H。根据该顺序,逐个删除样本中重要性较小的数据,然后对神经网络进行训练与估算,得出相应的实验数据结果。
3.2实验结果与分析
以符合率作为标准对实验结果进行如下分析。
3.2.1实验数据
对于医学实验,由于每个个体之间存在着一定的差异,不存在唯一的判定标准。因此,依据惯例,本实验所设定的模型评价标准为15%符合率、30%符合率与50%符合率。其中15%符合率的定义表达式为
15%符合率=GFR与eGFR的相对误差<15%的患者总数总患者数
而30%符合率和50%符合率可类似定义。表1为7输入变量的RBF神经网络的输出结果与逐个删除6个输入变量(H,Alb,A,W,S和Bun)分别所得到的数值实验结果。
从表1中可以看出,6输入变量的神经网络实验数据综合表现最好(该行已加粗),其中在测试组中15%符合率达到了48.71%,为相同标准下最好的实验数据结果。在输入变量数从5减到4时,测试组的15%符合率有着一个明显的下降趋势。这说明Age这个因素对GFR的估算起到一个明显的作用。
表2是分别删除其中一个变量所得到的6输入RBF神经网络的实验结果。从表2可以看出,在校验组和测试组中,删除H(即身高)得到的6输入RBF神经网络的综合表现最优。此外,从表2的第四行与第五行中可以看出,删除A或者Scr后的估算准确率明显降低,即A与Scr这两个因素的缺失会给神经网络的估算能力造成巨大的下降。
因此,本文保留A与Scr两个输入变量重新构建新的RBF神经网络并进一步实验,其实验结果如表3所示。观察表3中的内部校验组,可以看出2输入变量的神经网络的15%符合率和50%符合率更高。观察两个网络的外部校验组可以得出,两者的15%符合率与30%符合率一致,但是2输入变量的神经网络的50%符合率更高。综上所述,2输入变量(A&Scr)的神经网络在所有测试的RBF神经网络中性能最佳。
3.2.2对比实验
至今,不少估算肾小球滤过率的方法已经出现,其中经验方程的代表:CG方程和中国方程流传最为广泛。
CG方程:
GFR[ml/min/(1.73m2)]=[(140-年龄(岁))×体重(kg)×(0.85如是女性)]×体表面积(m2)÷1.73÷(72×Scr(mg/dL)),其中Scr单位换算为1μmol/L=0.0113mg/dL;体表面积用Dubois公式计算:体表面积(m2)=0.007184×体重(kg)×0.425×身高(cm)×0.725。
表32输入(A&Scr)RBF神经网络与6输入(删H)
如是女性)。
不仅存在经验方程,更存在另外一些神经网络[1,3],如3-WASD-6神经网络,也曾被提出用来估算肾小球滤过率。
表4是进一步将2输入(A&Scr)的RBF神经网络、CG方程、中国方程和3-WASD-6神经网络在测试组中对比得到的估算结果。从表4可以看出,2输入变量(A&Scr)的RBF神经网络在15%符合率和50%符合率中都有明显优势,在30%符合率中也具有较好的估算能力。从上述数值实验结果可以得出如下结论:神经网络相对传统方程在肾小球滤过率的估算上更具有效性,而2输入变量(A&Scr)的RBF神经网络性能更优。
4结束语
针对肾小球滤过率的检测存在费用昂贵或者准确性低的局限性,本文应用RBF激励WASD神经网络去估算患者的肾小球滤过率。计算机数值实验结果证实:以年龄(A)和血清肌酐(Scr)作为输入变量的2输入(A&Scr)的RBF神经网络能很好地估算GFR。
参考文献
[1]LIUX,PEIXH,LINS,ZHANGYN,etal.Improvedglomerularfiltratioateestimationbyanartificialneuralnetwork[J].PlosOne,2013,8(3):e58242(1-9).
[2]陆晨,杨淑芬,岳华.慢性肾脏病的流行病学调查现状[J].医学综述,2008,14(3):370-372.
[3]林佩仪.慢性肾脏病患者心血管疾病危险因素及其治疗现状研究[D].上海:复旦大学,2012.
[4]张雨浓,刘迅,何良宇,等.应用WASD神经网络估算肾小球滤过率的研究[J].中国科技信息,2014,(8):212-216.
[5]武飞周,薛源.智能算法综述[J].工程地质计算机应用,2005,(2):9-15.
[6]李季,樊慧津.低轨无拖曳卫星的自适应神经网络控制器设计[J].计算技术与自动化,2014,33(2):1-6.
[7]周荔丹,童调生.基于RBF模糊神经网络模型的广义预测控制[J].计算技术与自动化,2001,20(3):5-7.
[8]林涛,葛玉敏,安玳宁.基于RBF神经网络的钢构件质量追溯系统研究[J].计算技术与自动化,2015,34(1):20-24.
[9]宋保强,付琼,宋彤.改进的RBF神经网络及其应用[J].计算技术与自动化,2001,20(3):66-69.
[10]张顶学,刘新芝,关治洪.RBF神经网络算法及其应用[J].石油化工高等学校学报,2007,20(3):86-88.
[11]王学全,刘君梅,杨恒华,等.应用神经网络RBF估算青海省东南沙区土壤蒸发[J].干旱区研究,2012,29(3):400-404.
[12]刘健,孙鹏,倪宏.基于神经网络的用户兴趣度估计[J].计算机工程,2011,37(7):187-190.
[13]张雨浓,杨逸文,李巍.神经网络权值直接确定法[M].广州:中山大学出版社,2010.
[14]张雨浓,李克讷,谭宁.中心、方差及权值直接确定的RBF神经网络分类器[J].计算技术与自动化,2009,28(3):5-9.
[15]MAYC,LIZi,CHENJH,etal.ModifiedglomerularfiltratioateestimatingequationforChinesepatientswithchronickidneydisease[J].JournaloftheAmericanSocietyofNephrology,2006,17(10):2937-2944.
[16]刘迅.基于人工智能技术的慢性肾脏病分级预警模型研究[D].广州:华南理工大学,2012.
第35卷第1期2016年3月计算技术与自动化ComputingTechnologyandAutomationVol35,No1Mar.2016第35卷第1期2016年3月计算技术与自动化ComputingTechnologyandAutomationVol35,No1Mar.2016
(责任编辑:单位文秘网) )地址:https://www.kgf8887.com/show-251-99842-1.html
版权声明:
本站由单位文秘网原创策划制作,欢迎订阅或转载,但请注明出处。违者必究。单位文秘网独家运营 版权所有 未经许可不得转载使用