Literature
Home医源资料库在线期刊中华医学实践杂志2006年第5卷第3期

人工神经网络及其在疾病诊断中的应用

来源:中华医学实践杂志
摘要:人工神经网络(artificialneuralnetworks,ANN)是近年迅速发展起来的一门集神经科学、信息科学、计算机科学于一体的交叉、边缘学科,是生物神经网络在结构、功能及某些基本特性方面的理论抽象、简化和模拟而构成的一种信息处理系统[1]。其理论的应用已渗透到各个领域并取得非常令人瞩目的进展,近年来在医学领域的应......

点击显示 收起

    人工神经网络(artificial neural networks , ANN)是近年迅速发展起来的一门集神经科学、信息科学、计算机科学于一体的交叉、边缘学科,是生物神经网络在结构、功能及某些基本特性方面的理论抽象、简化和模拟而构成的一种信息处理系统[1]。其理论的应用已渗透到各个领域并取得非常令人瞩目的进展,近年来在医学领域的应用也越来越广泛,现对其基本理论及其在疾病诊断方面的应用综述如下。

  1  ANN的产生

  神经元是处理人体内各部分之间信息传递的基本单元。每个神经元都由一个简单处理作用的细胞体,一个连接其他神经元的轴突和树突组成。人的大脑正是拥有约上百亿个神经元这样庞大的信息处理体系,来进行感受、记忆、联想及反应等复杂的人脑思维。ANN就是在对人脑组织结构和运动机制认识理解基础上人工构造的能实现某种功能的理论化的人脑数学模型[2]。它兴起于19世纪末20世纪中期,1943年美国心理学家McCulloch和数学家Pitts合作提出了ANN的第一个数学模型(M-P模型)[3],从此开创了ANN的理论研究时代。其后,Rosenblatt[4]等众多学者又先后提出了感知模型、BP网络及Hopfield网络等更为复杂的网络模型及改进方法,使得ANN技术得以蓬勃发展。

  2  人工神经元模型与网络结构

  一个ANN的神经元模型和结构描述了一个网络如何将它的输入矢量转化为输出矢量的过程。通过选取不同的模型结构和激活函数,可以形成各种不同的ANN,达到不同的设计目的,完成不同的任务。

  2.1  人工神经元模型(artificial neuron model)  一般是一个多输入/单输出的非线性元件,如图1显示了一个具有r个输入分量的神经元模型。输入分量pj(j=1,2,...,r)通过与和它相乘的权值分量wj(j=1,2,...,r)相连,以∑r   j=1WjPj的形式求和后,形成激活函数f(.)的输入,激活函数的另一个输入是神经元的阈值b。

  神经元模型的输入输出关系可表示为:a=f(∑r   j=1WjPj+b)

  图1  人工神经元模型    (略)

  若将此模型与生物神经元相对照,则权值w对应于突触的联结强度,细胞体对应累加器∑和激活函数f(.),神经元输出a代表轴突的信号。

  在网络的设计中,具有固定常数为1的输入的阈值起着重要的作用,能使激活函数的图形左右移动从而增加解决问题的可能性。激活函数是神经元及网络的核心,常用的有硬限制型、线性型及S型。其作用是控制输入对输出的激活作用;对输入、输出进行函数转换和将可能无限域的输入变换成指定的有限范围内的输出。

  2.2  网络结构(network architecture)  单个神经元的功能非常有限,并不能满足实际应用的要求。在实际应用中需要有多个并行操作的神经元,这些可以并行操作的神经元组成的集合称为“层”。如图2所示,ANN分为输入层、隐含层及输出层。

  图2  神经网络模型    (略)

  当输入ANN一组数据(或称输入模式),网络输入层的每个单元都接受到输入模式的一部分,对输入模式缓冲后,通过输入层与隐含层的连接权重将输入信息传至隐含层;隐含层中的各处理单元有的兴奋,有的抑制,经过隐含层处理过的信息传至输出层;输出单元将隐含层单元的输出作为自己的输入,同时也经过隐含层与输出层间权重矩阵及输出单元阈值的作用,在激活函数处理后也有的兴奋,有的抑制。输出层单元输出的模式就是网络对输入模式激活的总效应。

  多层网络比单层的功能强大,但因网络节点及层数越多,训练时间会越长,所以大多数实际的ANN仅仅只有二到三层,很少有四层或多层。

  3  网络的学习和训练

  ANN的一个显著特征是它通过向环境学习获取知识并改进自身性能从而来解决问题,所以要想用ANN解决实际问题必须先让它学习或者说对它训练,让它掌握输入样本的内在规律性,从而才能完成对新样本的正确识别、分类或做出某种响应。网络在学习过程中不是通过修改单元本身来完成训练,而是靠改变网络中的连接权重进行学习[5]。网络训练和学习的内涵相同,只不过训练是一外部过程,对网络来说是一个被动过程,而学习则是网络掌握权重矩阵及阈值的主动过程。网络训练方式包括递增训练和批训练;学习规则分为监督(有导师)学习和无监督(无导师)学习[6]。

  4  ANN的特点[2,4,7]

  4.1  高度的并行性  ANN是由许多简单元件并联组合而成,虽然每个元件的功能简单,但大量简单元件的并行活动,使其对信息的处理能力与效果惊人。

  4.2  强大的非线性作用  ANN的每个神经元接受大量其他神经元的输入,并通过并行网络产生输出,影响其他神经元,网络之间的这种互相制约和影响,实现了从输入状态到输出状态空间的非线性映射。网络整体性能不是网络局部性能的简单叠加,而是表现出某种集体性的行为,这允许ANN能更好地进行数据拟合。

  4.3  良好的容错性和稳健性  ANN结构内部存在神经元之间的复杂连接和可变的连接权值矩阵,在模型运算中形成高度的冗余,使网络具有良好的容错性和稳健性,这使其在存在不确定数据和测量误差时仍能准确地的进行预测。

  4.4  自组织、自适应、自学习能力  ANN可以通过训练和学习来获得网络的权值与结构,呈现出很强的自学习能力和对环境的自适应能力。

  4.5  局限性  网络实体与要处理的问题相去甚远,领域专家很难理解用数据化的节点、权值和连接来描述他们要解决的问题。此外,网络是“黑箱推理”,全部知识存储于网络内部,难以提供可信的解释。最后,在训练阶段存在训练时间长,过度拟合或训练不足,网络麻痹及局部最小值等问题。

  5  ANN技术在疾病诊断中的应用

  在临床工作中医生大多是凭借一些临床资料如患者症状、体征以及各种检查结果根据临床经验得出结论,但疾病的诊断存在大量的特例及反例,信息来源既不完整又含有假象,且经常遇到不确定性信息,哪些资料的价值大应着重考虑,哪些只作次要考虑,各个医生的意见有时很不一致,这往往使决策相互矛盾或无理可循。传统方法诊断效果不够理想,虽然专家系统的研制和应用取得了重大进展,但在实现类似人脑的学习、联想等方面存在着知识获取的“瓶颈”问题[8,9]。而ANN的自学习、联想记忆、高度并行、容错等功能可以突破这一障碍,根据已学会的知识和处理问题的经验对复杂问题做出合理的判断,因此,ANN很适用于医学领域的疾病诊断,国内外已有很多成功的范例。

  5.1  ANN疾病诊断模型  以病人的临床资料为输入变量,以是否为某种疾病为输出变量来建立诊断模型。诊断模型包括两个基本程序:训练和测试。

  训练:将描述病人各种情况的数据作为网络的输入数据加到其输入端,同时调整神经元之间的连接权值以使网络的输出和实际的病例情况相符,即当病人确实患有某种疾病时网络的输出结果也恰好指示为该种疾病,反之亦然。若训练集网络的输出基本上(95%或更高)与实际结果一致,则训练过程结束,认为ANN已建立起病人的各种因素与他是否为某疾病患者之间的函数映射关系。为了使函数关系具有普遍性, 以便提高准确性,一般对某种疾病往往要输入数百上千的样本才能获得良好训练的ANN系统[10]。

  测试:对新的候诊病人,将他的情况输入到训练好的神经网络中去,根据网络的输出结果就可以知道他是否患有此种疾病。

  5.2  ANN应用于疾病诊断的灵敏度和特异度较高  ANN最早在临床医学中应用的领域之一就是临床疾病诊断。早在1991年,Baxt[11]将ANN用于心肌梗死的诊断,通过适当训练的ANN诊断心肌梗死的敏感度为97.2%,特异度为97.5%,明显高于临床医生(77.7%,84.7%)。

  El-Solh等[12]将ANN应用于活动性肺结核的诊断,结果训练集中ANN正确诊断肺结核的灵敏度为100%,特异度为72%,医生的灵敏度为47%,特异度为75%;测试集中ANN的灵敏度为100%,特异度为69%,医生的灵敏度为64%,特异度为79%。显然ANN诊断活动性肺结核的能力高于医生的临床评价,测试集的结果还表明所建的ANN能很好地推广到新病人的诊断。不过,研究中提到ANN易导致过度拟合,特别是在增加隐含层神经元来提高网络处理能力时更是如此。国内王家祥等[13]探讨了ANN在肝癌诊断中的应用价值。结果其对肝癌诊断的准确率、敏感性和特异性分别为91.7%、88.2%和94.6%,较以往的传统方法具有更高的敏感性和特异性,但本组病例偏少(106例),有必要继续积累病例资料进一步深入研究。

  为了验证ANN在鉴别恶性肿瘤和提示原发灶不明肿瘤的原发部位中的应用价值。杨美琴等[14]建立了8种血清肿瘤标志物(TM)ANN诊断模型,结果在未参考各种TM阈值范围的情况下,经计算机盲法检验所有鉴别模型准确率都达80%以上。此研究也提到其病例数不多(133例),预计增加更多的检测样本后,可进一步提高检测效果。

  另有一大样本资料用于冠心病诊断的研究,赵炳让等[15]通过1200份病例的训练,300例用于训练时的检测,然后对167例病例进行模拟诊断。结果ANN诊断的准确性为91.02%,敏感性及特异性分别为92.79%和87.50%。并可对初次就诊者做出正确的判断,可在不同医院,特别是社区医疗中帮助医生对不同年龄、性别、病史的患者进行临床判断,确定进一步需要处理的方案。

  目前,ANN已用于许多疾病诊断,包括帕金森病[16]、阿尔茨海默病[17]、癫痫病[18,19]、孤立性肺结节鉴别诊断[10,20],肌肉萎缩[21],膀胱出口梗阻[22],泌尿道结石[23] 、肺栓塞[24]等。

  5.3  ANN与专家系统相结合  ANN与专家系统(在某领域内具有专家水平解题能力的程序系统),作为人工智能应用的两大分支,在实际应用中都有许多成功的范例。但作为单个系统来讲,二者都存在局限性,主要是ANN知识表达的“黑箱结构”[25]和专家系统知识获取的“瓶颈问题”。为解决这个问题,可将两种技术相结合,达到优势互补的目的,利用ANN优良的自组织、自学习和自适应能力来解决专家系统知识获取的困难,同时用专家系统良好的解释机能来弥补ANN中知识表达的缺陷,从而加速了ANN在疾病诊断中的应用和发展。

  侯桂英等[26]将ANN与专家系统相结合建立高血压智能诊断系统,其鉴别原发性高血压与继发性高血压的敏感性、特异性及准确性均为100%;对原发性高血压分级的诊断准确率及危险度的评价准确率分别为100%和98.86%。Tan等[27]建立的EVoC智能诊断系统通过肝炎数据库、威斯康星州乳癌数据库及威斯康星州诊断的乳癌数据库的训练和模拟诊断,准确度分别为94.34%,96.37%及99.13%。表明基于ANN和专家系统的智能医疗诊断方法用于疾病的诊断具有较高的准确性,为临床医师在疾病诊断中提供一个新的思路与方法。

  6  结束语

  ANN具有自学习、自适应性和非线性处理等优点,能使疾病诊断操作智能化、并具有较高可信度,将极大减轻人们的工作负担。但应用中还存在一些亟待解决的问题。疾病诊断的复杂性为ANN的进一步发展提供了一块肥沃的土地,ANN所具有的优点和特性将使它成为医学中疾病诊断预测研究的有效工具。

  【参考文献】

  1  王黎明,付庆诏,冯天瑾,等.人工神经网络在超声诊断附件包块良恶性中的应用.中华超声影像学杂志,2004,13(8):597-600.

  2  丛爽.面向MATLAB工具箱的神经网络理论与应用.北京:中国科学技术大学出版社,1998,

  3  McCulloch WS, Pitts W. A logical calculus of the ideas imminent in nervous activity.Bull Math Biphys,1943, 5:115-133.

  4  Farid EA. Artificial neural networks for diagnosis and survival prediction in colon cancer.Molecular Cancer,2005,4:29.

  5  Martina Mueller,Carol L,Wagner,et al.Predicting extubation outcome in preterm newborns:a comparison of neural networks with clinical expertise and statistical modeling.Pediatric Reseach,2004,46(1):11-18.

  6  郑波,张克荣.人工神经网络及其在卫生检验中的应用.中国卫生检验杂志,2003,13(2):137-140.

  7  卜宪敏,郑智勇,余英豪.神经网络在病理学自动识别中的应用.中国体视学与图像分析,2005,10(2):122-126.

  8  蔡航.基于神经网络的医疗诊断专家系统.数理医药学杂志,2002,15(5):294-295.

  9  陈真诚,蒋勇,胥明玉,等.人工智能技术及其在医学诊断中的应用及发展.生物医学工程学杂志,2002,19(3):505-509.

  10  沈慧聪,王淼淼,李智勇,等.人工神经网络在孤立性肺结节鉴别诊断中的应用初探.实用放射学杂志,2004,20(10):886-887.

  11  Baxt WG.Use of an artificial neural network for the diagnosis of myocardial infarction.Ann Intern Med,1991,115(11):843-848.

  12  Ali A.El-Solh,Chiu-Bin Hsiao,Susan Goodnough,et al. Predicting active pulmonary tuberculosis using an artificial neural network.Chest,1999,116:968-973.

  13  WANG Jiaxiang,ZHANG Bo,YU Jiekai,et al.Application of serum protein fingerprinting coupled with artificial neural network model in diagnosis of hepatocellular carcinoma.Chin Med J,2005,118(15):1278-1286.

  14  杨美琴,郁琳琳,余捷凯,等.人工神经网络肿瘤标志物模型的建立及应用研究.中华检验医学杂志,2005,28(5):492-494.

  15  赵炳让,胡北来,秦勤,等.人工神经网络在冠心病诊断中的应用.天津医药,2002,30(9):575-576.

  16  常崇旺,陈洪,李维新.人工神经网络诊断帕金森病的应用研究.中国临床康复,2003,7(28):3818-3819.

  17  Monica Di Luca,Enzo Grossi,Barbara Borron,et al.Artificial neural networks allow the use of simultaneous measurements of Alzheimer Disease markers for early detection of the disease.Journal of Translational Medicine,2005, 3(30):1479-5876.

  18  N Acir,I Oztura,M Kuntalp,et al.Automatic detection of epileptiform events in EEG by a three-stage procedure based on artificial neural networks.IEEE Trans Biomed Eng,2005,52(1):30-40.

  19  Srinivasan V,Eswaran C,Sriraam N.Artificial neural network based epileptic detection using time-domain and frequency-domain features.J Med Syst,2005,29(6):647-660.

  20  Yuichi Matsuki,Katsumi Nakamura,Hideyuki Watanabe,et al.Usefulness of an artificial neural network for differentiating benign from malignant pulmonary nodules on high-resolution CT.AJR,2002,178:657-663.

  21  姜明丽,陈先农.人工神经网络在肌电信号处理中的应用.国外医学·生物医学工程分册,2005,28(2):94-97.

  22  Wadie BS,Badawi AM,Ghoneim MA.The relationship of the international prostate symptom score and objective parameters for diagnoing bladder outlet obstruction. Part II:the potential usefulness of artifcial neural networks.J urol,2001,165(1):35-37.

  23  Rajan,Prabhakar,Tolley,et al.Artificial neural networks in urolithiasis.Current Opinion in Urology,2005,15(2):133-137.

  24  陈新平,张阳德.临床医学中的神经网络技术.中国现代医学杂志,2003,13(9):46-50.

  25  J.G.Laffey,E.Tobin,J.F.Boylan,et al.Assessment of a simple artificial neural network for predicting residual neuromuscular block.British Journal of Anaesthesia,2003,90(1):48-52.

  26  侯桂英,孙佰清,关振中,等.应用智能医疗诊断系统诊断高血压的研究.哈尔滨商业大学学报,2003,37(3):223-225.

  27  KC Tan,Q Yu,CM Heng,et al.Evolutionary computing for knowledge discovery in medical diagnosis.Artificial Intelligence in Medicine,2003,27:129-154.

  (编辑:罗  彬)

  作者单位: 272013 山东济宁,济宁医学院流行病学教研室(Δ通讯作者)

作者: 宋烨,杨本付 2006-8-20
医学百科App—中西医基础知识学习工具
  • 相关内容
  • 近期更新
  • 热文榜
  • 医学百科App—健康测试工具