1 / 61
文档名称:

A识别算法.pdf

格式:pdf   页数:61页
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

A识别算法.pdf

上传人:164922429 2015/11/4 文件大小:0 KB

下载得到文件列表

A识别算法.pdf

相关文档

文档介绍

文档介绍:万方数据
西安电子科技大学
独创性(或创新性)声明
本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的研究
成果。尽我所知,除了文中特别加以标注和致谢中所罗列的内容以外,论文中不
包含其他人已经发表或撰写过的研究成果;也不包含为获得西安电子科技大学或
其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做
的任何贡献均已在论文中做了明确的说明并表示了谢意。
申请学位论文与资料若有不实之处,本人承担一切相关责任。

本人签名: 日期






西安电子科技大学
关于论文使用授权的说明
本人完全了解西安电子科技大学有关保留和使用学位论文的规定,即:研究
生在校攻读学位期间论文工作的知识产权单位属西安电子科技大学。本人保证毕
业离校后,发表论文或使用论文工作成果时署名单位仍然为西安电子科技大学。
学校有权保留送交论文的复印件,允许查阅和借阅论文;学校可以公布论文的全
部或部分内容,可以允许采用影印、缩印或其它复制手段保存论文。(保密的论
文在解密后遵守此规定)
本学位论文属于保密在年解密后适用本授权书。

本人签名: 日期

导师签名: 日期

万方数据
摘要
V(Copy Number Variation)是指 1kb 以上的 DNA 片段的增加
V 是基因组结构变异的重要组成部分,是人类疾病的重要致病因素
之一。A (RCNA)是与某种疾病有关的,存在于绝大多数样本相同染
色体区域的一段连续的拷贝数变异,它与肿瘤、癌症等疾病有着重要的关系,识
别 RCNA 对于疾病的研究有着重要的意义。目前已经有很多算法用于 RCNA 的
识别,这些算法各有优缺点,但仍然没有一个算法能够准确的识别出各种情形的
RCNA。CMDS 算法是一个有效查找 RCNA 的算法,它根据相邻两列数据的相关
性对数据进行打分,根据每一列的得分,判断出 RCNA 的位置。CMDS 算法计算
量小,效率较高,统计特性强,但是它不能识别出变异是增益还是缺失,对于变
异程度较敏感,容易受到一些随机变异的拷贝数的影响。
本文首先对拷贝数进行了数据仿真,对 CMDS 算法的优缺点进行了分析,提
出了一种基于聚类的 RCNA 识别算法。该算法首先对数据进行了预处理,接着运
用聚类算法对数据聚类,根据聚类的结果对每一列进行打分,最后根据得分判断
出 RCNA 的位置。本文还针对 CMDS 算法的不足进行了改进,称为 CMDS_s 算
法。在仿真数据上,针对各种情形的 RCNA 分别用 CMDS 算法、CMDS_s 算法
和本文算法进行了对比实验。实验结果表明,本文算法的性能优于 CMDS 算法,
也优于 CMDS_s 算法,但是在某些特殊情况下,CMDS_s 算法具有一定的优势。

关键字:拷贝数变异 RCNA 聚类



万方数据
Abstract
Copy number variation (CNV) is the main type of structure variation caused by
genomic rearrangement, which mainly includes gain and lose, that is 1kb or larger
genomic segments. The mutation rate V is much higher than of single nucleotide
polymorphism (SNP). CNV has been recognized as one of the main ic factors
underlying human diseases. A A (RCNA) is A that occurs in multiple
patients across the same chromosomal region. RCNA is often identified as more
significant events with greater implication in tumorigenesis. There are some methods
for identifying RCNA, but there is still no a method can accurately identify the various
situation of RCNA. Finding A regions remains a