蛋白质数据库是专门收集、整理和储存蛋白质相关信息的数据库。主要的蛋白质数据库包括:PDB(蛋白质数据库)、Swiss-Prot(瑞士-普罗特蛋白质数据库)、TrEMBL(翻译的EMBL数据库)、UniProt(全球蛋白质数据库)、Pfam(蛋白质家族数据库)等。其中,PDB是世界上第一个公开的生物大分子三维结构数据库,主要收集所有生物大分子的三维结构数据。收录的数据包括蛋白质、核酸的原子坐标、水分子和配位离子等信息,这些信息大多数来源于X射线晶体衍射和核磁共振(NMR)等实验方法。
一、PDB(PROTEIN DATA BANK)
PDB是全球公认的生物大分子三维结构数据的中心数据库。1971年,PDB在美国的布鲁克海文国家实验室成立,其初衷是为科学家提供一个可靠的数据源,收集所有的蛋白质和核酸的三维结构信息。PDB提供的三维结构数据,为研究生物分子的结构、功能、动力学和进化提供了重要的实验依据。
二、SWISS-PROT(SWISS-PROTEIN DATABASE)
Swiss-Prot是一个高质量的蛋白质序列数据库,1986年在瑞士日内瓦大学和瑞士生物信息学研究所创建。Swiss-Prot注重数据的质量和注释,提供了丰富的蛋白质功能信息,包括蛋白质的功能描述、蛋白质家族信息、序列特征、交叉引用和文献引用等。
三、TREMBL(TRANSLATED EMBL DATABASE)
TrEMBL是一个根据EMBL核酸序列数据库翻译得到的蛋白质序列数据库。TrEMBL的数据主要来自于基因预测和基因组项目,其数据量大,更新快,但注释信息相对较少。
四、UNIPROT(UNIVERSAL PROTEIN DATABASE)
UniProt是一个全球化的蛋白质数据库,2002年由Swiss-Prot、TrEMBL和PIR三大数据库组织联合创建。UniProt以高质量、免费和方便使用为目标,致力于提供全面、准确、及时的蛋白质信息。
五、PFAM(PROTEIN FAMILIES DATABASE)
Pfam是一个包含了大量蛋白质家族和功能域信息的数据库。Pfam使用隐马尔可夫模型来描述蛋白质家族和功能域,这种方法具有较高的准确性和效率,使得Pfam成为了研究蛋白质功能和进化的重要工具。
相关问答FAQs:
1. 什么是蛋白质数据库?
蛋白质数据库是专门收集和存储蛋白质序列、结构、功能和相互作用等信息的数据库。它们是生物信息学研究中非常重要的资源,用于蛋白质相关的研究和分析。蛋白质数据库可以帮助科学家们快速访问和查询蛋白质数据,从而加快科学研究的进展。
2. 有哪些常用的蛋白质数据库?
目前,有许多蛋白质数据库可供科学家们使用。以下是一些常用的蛋白质数据库:
-
UniProt:UniProt是一个综合性的蛋白质数据库,包含了来自多个来源的蛋白质序列和注释信息。它是最广泛使用的蛋白质数据库之一,提供了详细的蛋白质注释、结构、功能和相互作用等信息。
-
Protein Data Bank(PDB):PDB是一个专门存储蛋白质结构信息的数据库。它包含了来自全球各地的蛋白质结构数据,科学家们可以通过PDB查询具体蛋白质的结构信息,进一步研究其功能和相互作用。
-
STRING:STRING是一个专注于蛋白质相互作用的数据库。它整合了来自不同来源的蛋白质相互作用数据,可以帮助科学家们了解蛋白质之间的相互作用网络,从而推断蛋白质功能和信号通路。
-
NCBI:NCBI是美国国家生物技术信息中心的数据库,其中包含了许多与蛋白质相关的数据资源,例如GenBank、PubMed等。科学家们可以通过NCBI访问和查询蛋白质序列、结构和功能等信息。
3. 如何使用蛋白质数据库进行研究?
使用蛋白质数据库进行研究可以有多种方式。以下是一些常见的使用蛋白质数据库的研究方法:
-
蛋白质注释:科学家们可以通过蛋白质数据库查询特定蛋白质的注释信息,了解其功能、结构和相关文献等内容。这对于研究蛋白质的特定功能或特征非常有帮助。
-
蛋白质相互作用:蛋白质数据库中的相互作用信息可以帮助科学家们了解蛋白质之间的相互作用网络。这对于研究蛋白质信号通路、复杂疾病的发生机制等具有重要意义。
-
蛋白质结构预测:通过蛋白质数据库中的结构信息,科学家们可以预测蛋白质的三维结构。这对于研究蛋白质的功能和相互作用提供了重要的线索。
总之,蛋白质数据库是生物信息学研究中不可或缺的工具,它们为科学家们提供了丰富的蛋白质相关信息,促进了蛋白质科学研究的进展。
文章标题:什么数据库有蛋白质,发布者:不及物动词,转载请注明出处:https://worktile.com/kb/p/2818373