文档介绍:华大基因ss常用生物数据库和数据格式ScientificPartner华大基因G基本内容●生物数据库相关背景常用数据格式fasta,fast,gff,GenBank●常用序列数据库●美国国立生物技术信息中心(NCBI)欧洲生物信息学中心(EBI)●DDBJ常用基因功能数据库基因本体数据库(GeneOntology)京东基因与基因组百科全书(KEGG)Interpro蛋白功能数据库●常用基因组数据库UCSC基因组浏览器●Ensembl基因组注释数据库Seaz=0∽2zz0∽zUz=0∽WholeTranscriptomeFindGeneGenome/ariationSNPs,Vs,inden)andgenotypingtargetregionresequencingGenomeSequencing(Plants,animals,fungi,algea,bacteriaBAC/fosmid/WORKBJInterproSequenceDNADataBankofJapanSCOPTIGRswissprotprasieD,数据库也多。如何找到我们想要的数据库呢?ance>NucleicAcidsResearch>DatabaseSummaryPapercategorie2011NARDatabaseSummaryPaperCategoryListonpaperNucleotideSequenceDatabasesProteinseouencedatabaseGenomicsDatabases(non-VertebratemicroarrayDataandotherGeneExpressionDatabasescularBiologDatabase最新生物数据库列表(NucleicAcidsResearch),gff,GenBank●常用序列数据库●美国国立生物技术信息中心(NCBI)欧洲生物信息学中心(EBI)●DDBJ常用基因功能数据库基因本体数据库(GeneOntology)京东基因与基因组百科全书(KEGG)Interpro蛋白功能数据库●常用基因组数据库UCSC基因组浏览器●3peusnceforrChasteNmutinealanmernttormat-ipedigmertTAcuongformatextendedtreeformaor≈format●EMBLformat●GFFformat),aGATTT7G·AAT息AAC息TIGTGGTTIGGG式C息TCTCTTGGITAAAAAAAA描述行“>”分隔符一般50-100个字符每行没有标准的扩展名10