Literature
首页医源资料库在线期刊中华现代内科学杂志2007年第4卷第4期

基于数据挖掘技术探讨糖尿病相关实验室指标在胰腺癌诊断中的应用

来源:《中华现代内科学杂志》
摘要:【摘要】目的利用人工神经网络(artificialneuralnetworks,ANN)探讨糖尿病相关实验室指标在诊断胰腺癌中的应用。方法以住院患者为研究对象,包括98例胰腺癌患者和256例非胰腺癌的2型糖尿病患者,收集所有受试者的糖尿病相关实验室指标,包括血糖、糖基化血红蛋白、胰岛素、甘油三酯、低密度脂蛋白胆固醇、胱......

点击显示 收起

【摘要】  目的 利用人工神经网络(artificial neural networks,ANN )探讨糖尿病相关实验室指标在诊断胰腺癌中的应用。方法 以住院患者为研究对象,包括98例胰腺癌患者和256例非胰腺癌的2型糖尿病患者,收集所有受试者的糖尿病相关实验室指标,包括血糖、糖基化血红蛋白、胰岛素、甘油三酯、低密度脂蛋白胆固醇、胱抑素C等,建立ANN预测模型,并用确诊的胰腺癌患者数据对模型进行验证。结果 糖尿病相关实验室指标ANN模型预测胰腺癌的准确度达85.0%。结论 以糖尿病相关实验室指标建立的ANN预测模型对胰腺癌的辅助诊断能起到良好效果。

【关键词】  人工神经网络;胰腺癌;糖尿病;实验室指标

     Artificial neural network in diagnosis of pancreatic cancer based on diabetes correlated laboratory indicatrix mining

    LIU Qi-cai,GAO Feng,WANG Feng-qing,et al.Department of Laboratory,the First Affiliated Hospital,Fujian Medical University,Fuzhou 350005,China

    【Abstract】 Objective The application of diabetes correlated laboratory indicatrix artificial neural networks in diagnosis of pancreatic cancer.Methods Ninty-eight pancreatic cancer examples and 256 cases of non-cancer and T2DM were analyzed,GIU,HbA1c,INS,TG,LDL-C,Cystatin C,etc were samlped.ANN predictive model were established.Results The accuracy rate of diabetes correlated laboratory indicatrix ANN prediction model was 85%.Conclusion ANN predictive model established on diabetes correlated laboratory indicatrix in auxiliary diagnosis pancreatic cancer can get good effect.

    【Key words】 artificial neural networks;pancreatic cancer;T2DM

    随着医院信息系统(hospital information system,HIS)的普及,患者的数据得到广泛共享,人工神经网络(artificial neural networks,ANN)在医学领域的应用也得到了拓展[1]。近年来,胰腺癌(pancreatic cancer,PC)发病率呈上升趋势且死亡率极高[2],如何早期诊断成为国内外研究的热点,据大量的文献报道18%~26%的胰腺癌患者伴有糖尿病史[2,3],由此,我们通过分析胰腺癌患者的糖尿病相关实验室指标,建立人工神经网络预测模型,为胰腺癌的临床诊断提供参考。

    1 对象与方法

    1.1 对象 2004年5月~2006年12月来我院经病理确诊的胰腺癌患者98例,非胰腺癌的2型糖尿病患者256例,糖尿病的诊断参考1997年美国糖尿病协会制订的标准,即空腹8 h后,血浆Glu浓度≥126 mg/dl或者餐后的血浆Glu浓度≥200 mg/dl。

    1.2 变量的组成

    1.2.1 血糖控制和胰岛素敏感性指标 (1)OGTT中的空腹血糖水平(FPG)(mmol/L);(2)OGTT中的空腹胰岛素水平(FINS)(pmol/L);(3)OGTT中的餐后2 h血糖水平(PBG)(mmol/L);(4)OGTT中的餐后2 h胰岛素水平(FINS)(pmol/L);(5)糖化血红蛋白(HbA1c)(%)。

    1.2.2 糖尿病相关的脂代谢指标 (1)第一次就诊时的总胆固醇水平(TC)(mmol/L);(2)第一次就诊时的甘油三酯水平(TG)(mmol/L);(3)第一次就诊时的低密度脂蛋白胆固醇水平(LDL-C)(mmol/L);(4)体重指数(BMI)。

    1.2.3 糖尿病相关的肝、肾功能指标 (1)总胆红素水平(TBIL)(μmol/L);(2)γ-谷氨酰转肽酶水平(γ-GT)(u/L);(3)胱抑素C(Cystatin C)(mg/L);(4)肌酐(酶法)(CR)(μmol/L)。

    1.3 建模和训练

    1.3.1 变量筛选 应用数据偏回归补足8例变量F5空缺值,见表1,患者的糖尿病相关实验室指标(F1~F13)作为多因素变量,诊断作为目标参数。表1 HbA1c数据的偏回归系统估计及其假设检验注:回归方程:HbA1c=-0.8652+0.1132 BMI+0.2563 PBG+ 1.7453 TC-1.9231

    1.3.2 网络训练与测试 以78例胰腺癌患者和256例非胰腺癌的2型糖尿病患者的糖尿病相关实验室指标做规则分析并进行网络训练和建模。把诊断作为目标函数进行求解,剩余的20例胰腺癌患者数据用作测试,与ANN相关的分析用MATLAB 6.5软件完成,创建13个输入、单神经元的感知器,设定非胰腺癌的2型糖尿病目标输出值为0,当输出值在0与0.5之间时,归类为非胰腺癌的2型糖尿病患者。当输出值在0.5与1之间时,归类为胰腺癌患者。

    2 结果

    (1)在20例确诊的胰腺癌患者中,经ANN网络预测,17例与临床诊断吻合,判断准确率为85.0%(17/20)。(2)胰腺癌合并DM与T2DM主要糖尿病相关实验室指标的比较,见表2,18例胰腺癌合并DM患者与256例T2DM进行比较,主要的糖尿病相关实验室指标差异无统计学意义(P>0.05)。表2 胰腺癌合并DM与T2DM比较

    3 讨论

    糖尿病与胰腺癌的关系较为复杂[4],陆星华等认为糖尿病可能是胰腺癌的一个早期症状[2,5],我们的研究也发现18.36%的胰腺癌患者伴有糖尿病,而且糖尿病的诊断早于胰腺癌的诊断2~5年,这与文献[6]报道的基本一致,早期的胰腺癌易被糖尿病迷惑。本组选用糖尿病相关实验室指标,应用数据偏回归补足部分变量空缺值,同时抽取20例确诊的胰腺癌患者,将其F1~F13数据作为输入值分别进行模型验证,以检测网络的稳定性,结果显示ANN对胰腺癌预测效果显著,准确度达85%。

    在现实检查中,患者的实验数据不可能都完整,ANN属于非线性模拟系统,其特有的设计及工作原理使其对被分析的资料特性几乎没有任何限制,并对残缺数据资料以及干扰信号具有一定的处理能力[7],这使其在检验医学应用中具有其他信息处理方式无法比拟的优势。我们的实验也证实,糖尿病的单个实验室指标在区分2型糖尿病和胰腺癌方面不存在差异,而综合其13个指标的ANN辨别能力大大提高,而且糖尿病相关的实验室检测是临床上最常用的检验组合项目之一,因此其组合在胰腺癌的临床分析中更具有实用性。

    ANN网络是大样本集合,可以一定程度防止部分样本对总体预测的影响,ANN对信息的处理及推理过程具有高度并行性和容错性的特点使其能很好地处理带缺失或干扰项目的资料。通过对目标函数(诊断)的科学处理、利用MATLAB分类预测中模式之间的相似程度直接识别疾病状态原理[8],网络运行的样本数越大预测准确度越高。随着生物信息学在临床应用研究的不断发展,ANN在实际应用过程中还可对糖尿病患者的检测指标作进一步的优化选择,以提高胰腺癌的早期诊断率。

【参考文献】
  1 Pantapoulos D,Karakitsos P,Liossi I,et al. Comparing neural networks in the discrimination of benign from malignat lower urinary tract lesions. Br J Uro,1998,81:574-579.

2 陆星华,王丽,李辉,等.胰腺癌相关危险因素研究及高危评分模型的建立.中华消化杂志,2005,25(9):516.

3 Isher WE. Diabetes:risk factor for the development of pancreatic of the disease?World J Surg,2001,25:503-508.

4 Coughlin SS,Calle EE,Patel AV,et al. Predictors of pancreatic cancer mortality among a large colorectal of United States adults. Cancer Causes Control,2000,11: 915-923.

5 张学宏,高玉堂,邵常霞,等.既往疾病史与胰腺癌关系的流行病学研究. 肿瘤,2006,26(1):40.

6 徐海荣,刘世锋,李孝生.胰腺癌早期诊断的临床研究.基础医学论坛,2006,10(1):4.

7 高蔚,施侣,董福霞. 神经网络在预测糖尿病发病中的应用研究. 中华流行病学杂志,2002,23:391-393.

8 钱玲,施侣元,程茂金. 应用人工神经网络预测糖尿病/糖耐量异常.中国公共卫生,2003,19(10):1272-1274.


作者单位:1 350005 福建福州,福建医科大学附属第一医院检验科(△病理科) 2 福建福州,福建医科大学基因诊断研究室

作者: 刘奇才,,郜 峰,王凤清,洪国粦,林娜 2008-6-13
医学百科App—中西医基础知识学习工具
  • 相关内容
  • 近期更新
  • 热文榜
  • 医学百科App—健康测试工具