蛋白质数据库、原核及真核生物蛋白质数据库、原核及真核生物基因组分析基因组分析授课教师:许腾联系电话:18324234993(664993)电子邮箱:xutenggene@gmail.com第五节蛋白质数据库第五节蛋白质数据库基本定义:存放蛋白质相关信息的功能性数基本定义:存放蛋白质相关信息的功能性数据集,包括蛋白质的名称,物种来源,所具据集,包括蛋白质的名称,物种来源,所具有的各种生物学功能,以及序列本身等等。有的各种生物学功能,以及序列本身等等。有些数据库提供序列比对、序列下载等服务,有些数据库提供序列比对、序列下载等服务,不同的数据库特点不同。不同的数据库特点不同。国际上大型的公共蛋白质数据库包括国际上大型的公共蛋白质数据库包括UniProUniProt,PIR-PSD(t,PIR-PSD(已整合入已整合入UniProt),PDB,OMIM,UniProt),PDB,OMIM,GeneCardsGeneCards等。等。UniProtUniProtKnowledgeBase(UniProtKB)Swiss-ProttrEMBLREM-trEMBLSP-trEMBLUniRefUniParcTheUniProtArchive(UniParc)isacomprehensiveandnon-redundantdatabasethatcontainsmostofthepubliclyavailableproteinsequencesintheworld.TheUniProtReferenceClusters(UniRef)provideclusteredsetsofsequencesfromtheUniProtKnowledgebaseandselectedUniParcrecordsinordertoobtaincompletecoverageofthesequencespaceatseveralresolutionswhilehidingredundantsequencesfromview.UniProt(UniversalProteinResource)蛋白质数据库UniProtKB/Swiss-ProtproteinknowledgebasestatisticsUniProtKB/Swiss-Protproteinknowledgebasestatistics1INTRODUCTIONRelease2011_03of08-Mar-11ofUniProtKB/Swiss-Protcontains525997sequenceentries,comprising185874894aminoacidsabstractedfrom196176references.2013_12of11-Dec-13contains541954sequenceentries2.TaxonomicdistributionofthesequencesWithinEukaryota:Legend:gray=aliphatic,red=acidic,green=smallhydroxy,blue=basic,black=aromatic,white=amidlllf22Swiss-ProtSWISS-PROTSWISS-PROT由瑞士日内瓦大学医学生化系于由瑞士日内瓦大学医学生化系于19861986年创建,后来与欧洲分年创建,后来与欧洲分子生物学实验子生物学实验(EuropeanMolecularBiologylaboratory,EMBL)(EuropeanMolecularBiologylaboratory,EMBL)室合作,室合作,由瑞士生物信息学研究所(由瑞士生物信息学研究所(SwissInstituteofBioinformaticsSwissInstitut...