1 / 11
文档名称:

圆臀大黾蝽线粒体基因组密码子偏好性与COI基因适应性进化研究.doc

格式:doc   大小:18KB   页数:11页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

圆臀大黾蝽线粒体基因组密码子偏好性与COI基因适应性进化研究.doc

上传人:学习好资料 2022/5/28 文件大小:18 KB

下载得到文件列表

圆臀大黾蝽线粒体基因组密码子偏好性与COI基因适应性进化研究.doc

相关文档

文档介绍

文档介绍:圆臀大黾蝽线粒体基因组密码子偏好性与COI基因适应性进化研究
赵婉清 张敏 刘佳 高志忠 伊文博 柳大军 摘 要:利用CodonW、MEGA、EasyCodeML、CAIcal等软件及在线程序分析密码子偏好性相关参数(GC含量、其次,该基因虽然比较保守,但是它的进化速率仍然要比核基因快很多[10]。大量研究表明,昆蟲的COI基因受到较强的净化选择压力,但是在适应不同环境的前提下,物种面临的生存压力不同,COI基因作出的适应性进化选择也不相同[11]。本研究通过对圆臀大黾蝽线粒体基因组蛋白编码基因的密码子使用情况进行分析,了解该物种使用偏好性较高的密码子,确定最优密码,探究影响其密码子使用模式的因素,并比较异翅亚目昆虫COI基因的适应性进化,以期为昆虫线粒体基因的适应性进化提供新的研究思路。
1 材料与方法
序列获取 本研究所采用的序列均来源于NCBI数据库(https//www /),圆臀大黾蝽(Aquarius paludum)线粒体蛋白编码基因序列用于密码子偏好性分析,另下载20条异翅亚目COI基因序列用于适应性进化分析,详细信息见表1。
密码子偏好性的分析方法 Codon W软件和CAIcal在线程序用于统计有效密码子数(Effective Number of Codons,ENC)、密码子适应指数(Codon Adaptation Index,CAI)、密码子偏好指数(Codon Bias Index,CBI)以及序列总GC含量(GC)、密码子各位点GC含量(GC1,GC2,GC3)、密码子第3位同义密码子GC含量(GC3s)。序列的相对同义密码子使用度(Relative Synonymous Codon Usage,RSCU)运用MEGA 。最优密码子的筛选采用高表达优越密码子方法,按照ENC值大小分别选取有序数据集前后10%组成高、低表达数据集,根据2个数据集的△RSCU值来确定最优密码子。 对密码子偏好性影响因素的分析采用中性绘图分析和ENC-plot分析进行研究,分别以GC3和GC3s为横坐标,GC12和ENC为纵坐标作图。通过分析横纵坐标2因素的相关性,分析该物种密码子偏好性的成因。ENC-plot分析中所采用的的标准曲线方程为ENC=2+GC3S+29/[GC3S2+(1-GC3S)2]。
选择压力分析 用ω来表示基因受到何种选择作用的压力(ω=dN/dS),本研究基于EasyCodeML软件分析COI基因的选择压力。位点模型(Site Model)假设系统发育树的不同分支所受选择压力相同,但不同的氨基酸位点经历的选择压力不同。分别选取3组位点特异模型进行比较:M0(单一比率)与M3(离散),M1a(近中性)与M2a(正选择),M7(beta)与M8(beta & ω)。
2 结果与分析
碱基组成及相关参数 圆臀大黾蝽线粒体基因组共有13个蛋白编码基因,对这些序列的碱基组成进行了统计,结果如表2所示。从表2可以看出,序列的GC含量均低于50%,含量最高为COIII(%),最低为ATP8(%),说明圆臀大黾蝽线粒体基因组序列的AT含量远高于GC的含量。密码子3个位点的GC含量存在差异,除COII、CytB、ND1和ND4的密码子第1位点的GC含量高于第2位点的GC含量,其余基因密码子3个位点GC含量由大到小排列均为GC2>GC1>GC3,说明密码子第3位碱基更偏好使用A或U结尾。
ENC值、CAI值和CBI值的计算结果如表2所示。由表2可知,当ENC值越接近于20,密码子的偏好性越强,ENC值越接近于61,则偏好性越弱。~,,说明圆臀大黾蝽线粒体基因密码子使用具有一定的偏好性。~(),CBI值的范围为-~-(平均值-),这2项指标从基因表达水平和高表达密码子方面同样说明了圆臀大黾蝽线粒体基因密码子使用的偏好性。
同义密码子相对使用度及最优密码子 同义密码子相对使用度统计结果见表3。由表3可知,圆臀大黾蝽线粒体蛋白编码基因的密码子,共有30个密码子的RSCU值大于1(下划线标示)。其中,密码子第3位以A或U结尾的有28个,如UUA(RSCU=)、UCA(RSCU=)、UAU(RSCU=)等,以C结尾的有1个,以G结尾的有1个。在RSCU值小于1的密码子中,91%的密码子以G或C结尾。由于RSCU值表示密码子实际使用的频率与不考虑偏好性时理论情况下的使用频率间的比值,RSC