Literature
首页合作平台在线期刊中华中西医杂志2005年第6卷第6期病例报告

基因碱基序列分布的余弦拟合法

来源:INTERNET
摘要:从我们揭示了基因的碱基序列具有周期正弦波规律(将发表)后,碱基是否还有余弦波的规律。基因序列在4个基本碱基之间的周期振荡交叠的曲线、波动轨迹,若用常规数理统计的线性、非线性的数字拟合,直线、指数、乘幂、对数、二次方程,多项式等的渐进线拟合方法,几乎是不可能的,其相关程度很离谱,乱七八糟,当然相关就......

点击显示 收起

  从我们揭示了基因的碱基序列具有周期正弦波规律(将发表)后,碱基是否还有余弦波的规律?答案是肯定的。基因序列在4个基本碱基之间的周期振荡交叠的曲线、波动轨迹,若用常规数理统计的线性、非线性的数字拟合,直线、指数、乘幂、对数、二次方程,多项式等的渐进线拟合方法,几乎是不可能的,其相关程度很离谱,乱七八糟,当然相关就根本不可能了。当我们用三角函数的正弦拟合时,却得到了意外的成功:可以达到完美相关,R=1。影响正弦SIN理论预测与实验值误差或精准度的关键不是理论方程SIN本身,而是SIN中的周期变量π取值的有效位数,或小数点后数字的位数。正弦函数能够做到,余弦函数怎样?这就是本文要探询和揭示的基因序列深藏的秘密。“基因四进制”与信息守恒律。

    1 材料与方法

    1.1 基因序列的来源 AY644963下载自EMBL的EMBL-Bank,该基因有378个碱基:ATTCAGCAGCCTTTTTCTCATGCAGACTTGTAAATCTGGGAGTCTGTCAGTCAGTCAGTCAGCCAGTCAACTTTTCTGTTGGAAAGTCCGTCTTCATAAAGCCAGCATGTCTCTTGGGGAACCTGGCATTTTGTTAAAATAACAAGTGTTTAATTTTTCAGGGGAAATCCTGAAACAATGTATTCCTTTTTACCCGCCTCATGATGTCTGCACAGAGGCAGTTCAGCTGAGCTGCAAGCCCAGGCAGGCTGCTGGAAGTTCAGTCAGCTCCAGCATCCCCATGTTGTGCCTCCATCTGGATACTTCTGCAGCACCTGGCTTGGGCCAGAAATGGAGCAAATGGTTCCTCACATGTGTGTGGAAGGCCCTG GTCAGATC。

    1.2 方法

    1.2.1 实验基因碱基序列的符号坐标系方法 以基因碱基序列的排序号1,2,3,...,378,为X轴的横坐标x=1,2,3,...,378,碱基的四个基本组元A,G,T,C(基因四进制的个位)为Y轴的纵坐标y=A,G,T,C。

     1.2.2 碱基符号的数字化 由于符号化的碱基,目前暂时还没有相应的数学的处理方法,为研究方便起见,先将A,G,T,C碱基数字化,令A=1,G=2,T=3,C=4(用其它数也可以,用自然数比较自然方便直观),此后,这“斜黑体”的“1,2,3,4”就表示碱基的”A,G,T,C”符号。用数字代表示“基因四进制”,如其中的A=1,G=2,T=3,C=4。以坐标(X,Y)的数符对(1,A),(2,T),(3,T),....,(378,C),在X-Y坐标系上点点,做图。

    1.2.3 求标化数字碱基的反余弦、反正弦值,即碱基的弧度、角度值 弧度 cos =acos(y)=x  cos ,或弧度 sin =asin(y)=x  sin ,生成了余弦函数或正弦函数的“初相位”φ,见表1,图1。

    图1纵轴的反余弦函数acos(y)=φ与横轴的关系图

    表1 求标化数字碱基的反余弦、反正弦值,即碱基的弧度、角度值(略)

    1.2.4 理论预测 重构基因余弦(正弦)序列。y  cos =cos(x)×1.5+2.5。

    1.2.5 恢复数字碱基原值 y  cos =1.5cos(x)+2.5,计算制图,还原。并进行相关分析。

    2 结果和讨论

    基因的碱基分布有周期特性,具有三角函数的分布特征。三角函数值与实际值完全相关,相关系数R=1,图2,图3。基因由4个基本碱基组成,其周期规律性应极为强烈。距其最接近的就是三角函数样的周期运动。通过我们对AY644963基因的分析,揭示、发现了这个周期循环的规律,给出了AY644963基因的正弦波动和余弦波规律的内在机制。通过这项探索研究和演绎,充分显示了基因的特质和数理规律:三角函数的特点。为理论基因组的研究开辟了 新路。

    图2 弧度值与序号,数字碱基关系

    基因可以用三角函数解析基因碱基的数学奥秘。依据每个碱基在(单位)圆上的投影角度———弧度值,计算出基因碱基的正弦分布波谱。各位碱基分布的弧度值。图1, 图2曲线方向相反头,n≤100比较。

    图3 π取值对基因余弦序列拟合优度的影响
   
    预测值的精度,与π的取值小数位有关,取π=3.14时,相关系数R=0.9306,80位,及到108位后的预测值与实际值全都因为误差而错乱。π=3.141,R=0.9918;π=3.1415,R=0.9998;π=3.14159,R=1。π=3.1415926535.离谱π=3,R=0.0387不相关了明显。Y 3.14 <Y 3.141 <Y 3.1415 <Y 3.14159 ...<Y π ,小数点位数少远离真值,随着位数的增加,象真值靠近直至重合。同样的,小数点后取位,和有效数字,对基因碱基序列拟合预测的精度有影响,特别是在突变点更是如此,表1,受列宽度的限制,有效数字取的不多,结果的精度下调了。基因碱基序列的纵向分布,用三角函数的表述,是一种生命与数学的完美、艺术的、创造力的优美结合,为基因组,功能基因组等的研究和揭密开辟一块新天地。

    作者单位:100016北京清华大学第一附属医院
    北京八一中学
    北京将台中学

作者: 邓 宇 邓 非 邓 海 陈 蕾 葛建新 李丽玖 2005-6-14
医学百科App—中西医基础知识学习工具
  • 相关内容
  • 近期更新
  • 热文榜
  • 医学百科App—健康测试工具