点击显示 收起
1 材料与方法
1.1 基因序列的来源 AY644963下载自EMBL的EMBL-Bank,该基因有378个碱基:ATTCAGCAGCCTTTTTCTCATGCAGACTTGTAAATCTGGGAGTCTGTCAGTCAGTCAGTCAGCCAGTCAACTTTTCTGTTGGAAAGTCCGTCTTCATAAAGCCAGCATGTCTCTTGGGGAACCTGGCATTTTGTTAAAATAACAAGTGTTTAATTTTTCAGGGGAAATCCTGAAACAATGTATTCCTTTTTACCCGCCTCATGATGTCTGCACAGAGGCAGTTCAGCTGAGCTGCAAGCCCAGGCAGGCTGCTGGAAGTTCAGTCAGCTCCAGCATCCCCATGTTGTGCCTCCATCTGGATACTTCTGCAGCACCTGGCTTGGGCCAGAAATGGAGCAAATGGTTCCTCACATGTGTGTGGAAGGCCCTG GTCAGATC。
1.2 方法
1.2.1 实验基因碱基序列的符号坐标系方法 以基因碱基序列的排序号1,2,3,...,378,为X轴的横坐标x=1,2,3,...,378,碱基的四个基本组元A,G,T,C(基因四进制的个位)为Y轴的纵坐标y=A,G,T,C。
1.2.2 碱基符号的数字化 由于符号化的碱基,目前暂时还没有相应的数学的处理方法,为研究方便起见,先将A,G,T,C碱基数字化,令A=1,G=2,T=3,C=4(用其它数也可以,用自然数比较自然方便直观),此后,这“斜黑体”的“1,2,3,4”就表示碱基的”A,G,T,C”符号。用数字代表示“基因四进制”,如其中的A=1,G=2,T=3,C=4。以坐标(X,Y)的数符对(1,A),(2,T),(3,T),....,(378,C),在X-Y坐标系上点点,做图。
1.2.3 求标化数字碱基的反余弦、反正弦值,即碱基的弧度、角度值 弧度 cos =acos(y)=x cos ,或弧度 sin =asin(y)=x sin ,生成了余弦函数或正弦函数的“初相位”φ,见表1,图1。
图1纵轴的反余弦函数acos(y)=φ与横轴的关系图
表1 求标化数字碱基的反余弦、反正弦值,即碱基的弧度、角度值(略)
1.2.4 理论预测 重构基因余弦(正弦)序列。y cos =cos(x)×1.5+2.5。
1.2.5 恢复数字碱基原值 y cos =1.5cos(x)+2.5,计算制图,还原。并进行相关分析。
2 结果和讨论
基因的碱基分布有周期特性,具有三角函数的分布特征。三角函数值与实际值完全相关,相关系数R=1,图2,图3。基因由4个基本碱基组成,其周期规律性应极为强烈。距其最接近的就是三角函数样的周期运动。通过我们对AY644963基因的分析,揭示、发现了这个周期循环的规律,给出了AY644963基因的正弦波动和余弦波规律的内在机制。通过这项探索研究和演绎,充分显示了基因的特质和数理规律:三角函数的特点。为理论基因组的研究开辟了 新路。
图2 弧度值与序号,数字碱基关系
基因可以用三角函数解析基因碱基的数学奥秘。依据每个碱基在(单位)圆上的投影角度———弧度值,计算出基因碱基的正弦分布波谱。各位碱基分布的弧度值。图1, 图2曲线方向相反头,n≤100比较。
图3 π取值对基因余弦序列拟合优度的影响
预测值的精度,与π的取值小数位有关,取π=3.14时,相关系数R=0.9306,80位,及到108位后的预测值与实际值全都因为误差而错乱。π=3.141,R=0.9918;π=3.1415,R=0.9998;π=3.14159,R=1。π=3.1415926535.离谱π=3,R=0.0387不相关了明显。Y 3.14 <Y 3.141 <Y 3.1415 <Y 3.14159 ...<Y π ,小数点位数少远离真值,随着位数的增加,象真值靠近直至重合。同样的,小数点后取位,和有效数字,对基因碱基序列拟合预测的精度有影响,特别是在突变点更是如此,表1,受列宽度的限制,有效数字取的不多,结果的精度下调了。基因碱基序列的纵向分布,用三角函数的表述,是一种生命与数学的完美、艺术的、创造力的优美结合,为基因组,功能基因组等的研究和揭密开辟一块新天地。
作者单位:100016北京清华大学第一附属医院
北京八一中学
北京将台中学