1 / 11

融合过滤和相似度计算的高错误率基因组数据敏感序列识别 孙辉.pdf

格式:pdf   大小:1,628KB   页数:11页
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表




融合过滤和相似度计算的高错误率基因组数据敏感序列识别 孙辉.pdf

上传人:彩凤w 2022/5/19 文件大小:1.59 MB


融合过滤和相似度计算的高错误率基因组数据敏感序列识别 孙辉.pdf


文档介绍:: .
小型微型计算与 GWAS Catalog 数据库中敏感序列进行计算比对,以准确识别疾病相关序列;最后,
法 LRF 和 SRF 相比,本文算法对错误率 2%~20%的测序数据中敏感序列的平均识别准确率分别提高 %和 %,查
准率分别提高 %和 %,有效提升高错误率基因组数据中敏感序列识别的效果。
中图分类号:TP301 文献标识码:A
Recognizing Sensitive Sequences from Genomic Data with High Error Rate Integrating
Filter and Similarity Calculation
SUN Hui1,2,ZHONG Cheng1,2
1(School of Computer, Electronics and Information, Guangxi University, Nanning, Guangxi 530004, China)
2(Key Laboratory of Parallel Distributed Computing Technology in Guangxi Universities, Nanning, Guangxi 530004, China)
Abstract: To solve the problem that existing algorithms are difficult to effectively identify sensitive sequences from sequencing data
with high error rate, a recognizing sensitive sequence algorithm using filter and similarity calculation is proposed. Firstly, the
genomic sequence is divided into several short sequences, and a double Bloom filter is constructed to de-duplicate each short sequence.
Secondly, the local fragments of short sequences are encoded by k-mer , and the method for computing similarity of local fragments of
short sequences are improved to identify short tandem repeats. Thirdly, k-mer encoding short sequences and sensitive sequences in
GWAS Catalog database are aligned to identify disease-related sequences. Finally, according to the results of short sequence
identification, two mask sequences of the sequencing data are generated as the final results of identifying sensitive sequences from the
sequencing data. Experimental re


全科计划书 31页

2024年最新体育教育实习自我鉴定范文 8页

黄芪多糖对蛋鸡免疫功效及相关基因表达影响的.. 2页

黄粉虫丝氨酸胰蛋白酶样酶的基因克隆及在毕赤.. 2页

黄瓜“银杏叶”突变体遗传规律及生理特性的研.. 2页

2024年最新交通事故和解协议书 8页

黄土高原小流域土壤有机碳、氮时空变异与动态.. 2页

商业篮球场计划书 33页

2024年最新中学校长年终述职报告(通用5篇) 27页

鸭瘟病毒UL10基因分子特性及转录时相分析的开.. 2页

2024年最新个人读书心得体会 8页

社会实践的作文6篇 7页

社区课程活动计划书 31页

急性心力衰竭课件 35页

竞聘班长演讲稿(32篇) 45页

2024年最新《长津湖之水门桥》个人电影心得体.. 5页

简易信息咨询服务合同(33篇) 118页

粮食作物批发合同(3篇) 10页

终止合作经营协议书(3篇) 9页

高频用FE-Ni基纳米软磁薄膜的制备与研究的开题.. 2页

高陡边坡隧道洞口段危岩落石灾害防护技术的开.. 2页

美术教师学期教学工作计划5篇 12页

先进个人推荐对象先进事迹材料 51页

哈师大附中2024届高三第三次模拟考试英语试卷.. 11页

孕妇学校艾梅乙培训课件 32页

房屋建筑自然灾害综合风险普查工作实施方案 9页

2024成都三诊文、理科数学及答案详解 17页

财产保险公司人伤管理集中管理办法 21页

小学民族团结评选实施方案 5页

果实品质测定 7页