文档名称：

生物信息学数据库答案.pdf

格式：pdf 大小：576KB 页数：10页

下载后只包含 1 个 PDF 格式的文档，没有任何的图纸或源代码，查看文件列表

如果您已付费下载过本站文档，您可以点这里二次下载

预览

下载此文档

生物信息学数据库答案.pdf

上传人:小屁孩 2024/4/15 文件大小：576 KB

下载得到文件列表

生物信息学数据库答案.pdf

相关文档

文档介绍

文档介绍：该【生物信息学数据库答案】是由【小屁孩】上传分享，文档一共【10】页，该文档可以免费在线阅读，需要了解更多关于【生物信息学数据库答案】的内容，可以使用淘豆网的站内搜索功能，选择自己适合的文档，以下文字是截取该文章内的部分文字，如需要获得完整电子版，请下载此文档到您的设备，方便您编辑和打印。:..生物信息学数据库答案一、名词解释1、生物信息学(bioinformatics):指应用信息科学的理论、方法和技术,管理、分析和利用生物分子数据。通过收集、组织、管理生物分子数据,得到深层次的生物学知识,加深对生物世界的认识。2、核磁共振(NMR):核磁共振是指原子核吸收外界能量而产生一种能级跃迁现象,其实质是共振吸收。3、开放式阅读框(ORF):是基因的起始密码子开始到终止密码子为止的一个连续编码的序列。4、外显子(exon):指导合成mRNA时的DN***断,用于形成mRNA前体。也就基因的编码序列。5、中心法则:包括DNA的自我复制,转录形成RNA并翻译成蛋白质,RNA的自我复制和逆转录的过程。:..6、算法分析:评价一个算法的优劣,通过时间复杂度和空间复杂度来确定。7、数据库管理系统:(databasemanagementsystem,DBMS)对DB进行管理的系统工程,提供DB的建立、查询、更新以及各种数据控制功能。8、数据库:统一管理的相关数据的集合。9、搜索软件:对内容进行筛选,从中选择出符合用户的检索要求的内容同时进行分级排序,将结果显示出来。10、人类基因组计划(HGP):是对人类24条染色体上的3X109个碱基对(basepair,bp)序列进行测定,完成图谱绘制、测序、基因识别,及信息系统的建立。二、选择题(20分)1、GenBank数据库的网址是(B):2、PDB蛋白质数据库结构文件中上标的表示S2+方法是(D)A:S^2+BS=2+C:S<2+>D:S==2+==:..3、生物学文献数据库中可免费使用的是(C)A:OVIDB:CBIC:PUBD:BIOSISPreviews4、GBFF的数据格式中结尾标识是(A)A://B:!C:*D:<5、NCBI数据库中查询使用的是(D)。A:GoogleB:BaiDUC:YahooD:EntreZ6、遗传密码特点(D)A:密码无标点。B:密码简并性。C:密码通用性。D:三者都是。:..、检索和分析的科学(B)(B)。~2%~5%~10%~20%(A)。:..A:NBRF/PIR、:PIR、FASTA和GDEC:NBRF、:NBRF/PIR、(C)、填空题(20分)1、.生物信息学研究的重点是核酸与蛋白质两方面,包括了___序列__、___结构__、__功能___。以___基因组DNA序列信息__为出发点,破译___遗传语言_,认识_遗传信息___,辩别___DNA中的基因__,掌握基因的_调控信息____,对__蛋白质空间结构___进行模拟和预测,发现___蛋白结构和功能__,揭开生物生命的神秘面纱。2、生物分子携带的三种信息分别为:___遗传信息,结构信息,进化信息。:..3、人类基因组计划完成的4张图谱分别是___遗传图谱、物理图谱、序列图谱、转录图谱。4、多维数据库分析又称数据挖掘是对数据进行_归纳推理和联想,寻找数据之间的关系,从中发掘有价值的信息。其基本步骤为:数据选择、数据比较_、数据挖掘和结果分析。5、域名由以机构性质命名的域和_以国家地区代码命名的域_两种基本类型组成。6、双绞线的接法按照10/100BASET的规定有T568A_和T568B两种固定的标准,其中T568B的接线顺序为_橙白、橙、绿白、蓝_、蓝白、绿、_棕白、棕。遵循同级交叉异级平行的规律。7、数据模型:(datamodel)数据库结构和语义的一抽象描述,由数据结构、数据操作和完整性约束三部分组成。8、NCBI有四个核心元素_文献出处,DNA序列,蛋白质序列和三维结构。另外两个项目(分类和基因图),,VAST软件其同组成一个有机的数据库系统。9、常用的分子生物学技术包括限制性酶消化:.._、凝胶电脉、_印迹和杂交、DNA测序、_克隆及聚合酶链式反应。10、三大数据库是指:美国国家生物技术信息中心(NCBI)的_GenBank数据库;欧洲生物信息学研究所(EBI)所维护的EMBL数据库;日本国立遗传学研究所的DDBJ数据库。11、网络信息检索中高级检索技术有_加权检索,相似性检索和智能化检索。四、简答题(20分)1、简述生物信息数据库的功能。答:;2、生物学数据库的查询、搜索和数据的通信;3、生物学数据库实现生物学数据的一般分析和处理。2、简述生物学数据库目前发展的特征有哪些?答:a生物分子数据库的更新速度不断加快,数据量成指数增加。b数据库使用频率增长快,数据库的价值被人们逐渐认识到。c数据库的复杂程度不断增加。:..d数据库网络化。直接进行访问,公共数据库之间相互链接。e面向应和,不简单的只是数据集,加入了检索和分析工具,可以完成基本的分析功能。f先进的软件与硬件配置。服务器增多,服务软件也增加。3、GBFF格式是由哪三部分组成的?答:第一部分是描述符,从第一行LOCUS行到ORIGIN行,包含了整个记录的信息;第二部分是物性表,从FEATURES行开始,包含了注释这一记录的特性,是条目的核心,中间使用一批关键字;第三部分是序列本身,以//符号结尾。4、生物信息学建立的四类数据库都有哪些?答::一级数据库,是由国际组织建设和维护的数据库。这类数据库优点是完整,更新及时,提供了较好服务平台,但存在精确性、准确性没有经评估,数据过多,重复,分类较粗。一级数据库上开发的二级库,其专一性强,数据量相对少,但质量高,数据库结构设计更合理。专家库,经验专家进行人工校对标识后建立的。质量高,使用可靠,更新慢。整合的数据库。是将不同数据内容按一定的要求整合而成。商业和内部数据库是整合数据库。:..五、论述题(20)1、谈一谈数据库中三种常见序列文件格式的相同点和不同点。答:数据库的三种常用序列文件格式是NBRF/PIR、FASTA和GDE。一、相同点1、每种格式不仅能够表示序列本身,还可以插入唯一的代码来识别序列,并对序列进行说明,包括序列的名称,序列所属物种,序列的长度及功能等。2、虽然三种格式的扩展名不同,可是其实质都是文本文件。3、在序列中10个残基空一格,60个残基换一行,核酸残基有A、T、G、C、U五种碱基;蛋白质为二十种基本氨基酸符号。4、序列中存在的特别符号—代表不明长度的空位(gap);不明核酸用N,不明蛋白质是X;R代表G或A的嘌呤;Y代表T或C的嘧啶;K代表G或T(带***基);M代表A或C(带氨基);S代表G或C氢键强;W代表A或T弱;B代表G、T或C;D代表G、A或T;H代表A、C或T;V代表G、C或A;N代有:..A、G、C、T任意一种;*代表翻译结束。二、不同点1、NBRF/PIR格式;第一行以>P1开头是蛋白质序列>N1开头是核酸序列。分号后跟一个编号是序列的唯一标识号;_后是标识来源,之后是说明行,扩展名是”。Pir”or”.seq”。2、FASTA格式:第一行以>开头但没有指明是蛋白质还是核酸序列后的代码,接着注释,通常注释以“|”分开,第一行没有长度限制。FASTA格式允许以小写字母代表序列。扩展名为“.fasta”3、GDE格式:与FAST格式基本相同,但是行首是%号,扩展名为“.gde”。2、生信与生物学数据库的关系?此题学生根据自己对专业的认识结合自己的想法作答,无固定答案。