蛋白质数据库是指👉专门存储蛋白质相关信息的数据库。它们收集、整理和存储大量的蛋白质数据,包括蛋白质序列、结构、功能、互作关系、表达模式、疾病关联等信息。这些数据经过验证和标准化后,被整合到数据库中,使研究者能够方便地访问和利用这些数据进行各种研究工作。
01、SCOP蛋白质结构分类数据库
☑️网址:http://scop.mrc-lmb.cam.ac.uk/
几乎所有的蛋白质都与其他的蛋白质具有结构上的相似性,并且在某些情况下,它们具有共同的进化起源。SCOP数据库是由人工检查创建的,由一系列自动化方法支持,旨在提供对所有已知结构的蛋白质之间的结构和进化关系的详细和全面的描述。因此,它提供了对所有已知蛋白质折叠的广泛调查,以及关于任何特定蛋白质的近亲的详细信息,并为未来的研究和分类提供了一个框架。该数据库在2022.06.29的最新更新包括72544个非冗余结构域,代表861631个蛋白质结构。
02、PDB数据库
☑️网址:https://www.rcsb.org/
PDB是目前最主要的收集生物蛋白质三维结构的数据库,是通过X射线单晶衍射、核磁共振、电子衍射等实验手段确定的三维结构数据库。其内容包括蛋白质的原子坐标、参考文献、一级和二级结构信息,也包括了晶体结构因数以及NMR实验数据等。PDB数据库以文本文件的方式存放数据,每个分子各用一个独立的文件pdb。用三维视图软件打开pdb文件,可以查看蛋白质的立体结构。
03、UniProt数据库
☑️网址:https://www.uniprot.org/
UniProt整合了Swiss-Prot、TrEMBL和PIR-PSD三个数据库,主要优势在于添加了蛋白功能注释信息,具有更新速度快、与其他数据库联系密切、分析工具齐全、使用便捷的特点,成为了目前信息最丰富、资源最广的蛋白质数据库。
04、SWISS-PROT 数据库
☑️网址:https://ngdc.cncb.ac.cn/
SWISS-PROT是国际上主要的蛋白质序列数据库,在EMBL和GenBank数据库上均建立了镜像站点。该数据库包括了从EMBL翻译而来的蛋白质序列,这些序列经过检验和注释。该数据库的最新发展包括:对其他数据库的交叉引用,各种新的文档文件和对 TrEMBL的改进,TrEMBL是SWISS-PROT的计算机注释补充。
05、TrEMBL数据库
SWISS-PROT的数据存在一个滞后问题,即把EMBL的DNA序列准确地翻译成蛋白质序列并进行注释需要时间。一大批含有开放阅读框(ORF) 的DNA序列尚未列入SWISS-PROT。为了解决这一问题,TrEMBL(Translated EMBL) 数据库被建立了起来。TrEMBL也是一个蛋白质数据库,它包括了所有EMBL库中的蛋白质编码区序列,提供了一个非常全面的蛋白质序列数据源,但这势必导致其注释质量的下降。
06、PIR数据库
☑️网址:
https://proteininformationresource.org/
PIR数据库的数据最初是由美国国家生物医学研究基金会(National Biomedical Research Foundation, NBRF)收集的蛋白质序列,主要翻译自GenBank的DNA序列。
07、Pfam数据库
☑️网址:http://pfam.xfam.org/
一个蛋白质结构域家族的集合,主要用于分析蛋白质序列的结构域和相关蛋白质家族的,其中每一个蛋白家族都以多序列比对和隐马尔科夫模型的形式来表示。
08、CTAH结构分类数据库
☑️网址:http://cathdb.info/
CATH数据库是一个免费的、公开可用的在线资源,提供关于蛋白质结构域进化关系的信息。CTAH包括PDB数据库中四种结构分类层次依次为:C:class,蛋白质种类;T:topology/fold,蛋白质拓扑结构;A:architecture,蛋白质二级结构的构架;H:homologous superfamily 蛋白质同源超家族。
09、MMDB蛋白质分子模型数据库
☑️网址:https://www.ncbi.nlm.nih.gov/Structure/MMDB/docs/mmdb_publications.html
分子模型数据库(Molecular Modeling Database ,MMDB)由NCBI 的MMDB 研究小组维护。这是Entrez 检索工具所使用的三维结构数据库,以ASN,1 格式反映 PDB 库中的结构和序列数据。NCBI 同时提供一个配套的三维结构显示程序Cn3D。
10、BioXFinder数据库
☑️网址:https://bio.bcpmdata.com/
BioXFinder是国内第一个也是唯一一个生物数据库:收录50多万条高质量的、整合多个来源数据,手工注释的非冗余的蛋白质信息,包含蛋白质的基本信息、序列、序列特征、功能、名称和谱系、亚细胞定位、疾病与变异、翻译后修饰、表达、相互作用等信息;收录了19多万条经过X射线单晶衍射、核磁共振、电子衍射等实验手段确定的蛋白质结构数据。包括蛋白3D结构、基本信息、实验数据、参考文献等。
11、STING数据库
☑️网址:https://string-db.org/
STRING是一个蛋白质互作关系数据库,整合了多种数据源的蛋白质互作信息,包括实验验证的互作、计算预测的互作和文献报道的互作。它提供了蛋白质互作网络的可视化和分析工具,用于研究蛋白质相互作用网络和功能模块。
12、SMART数据库
☑️网址:http://smart.embl-heidelberg.de/
SMART是一个蛋白质结构和功能域注释数据库,提供了多个物种的蛋白质结构域的注释信息。它帮助研究人员理解蛋白质的功能和结构域的进化关系。
13、PANTHER数据库
☑️网址:http://www.pantherdb.org/
PANTHER是一个蛋白质家族和功能注释数据库,基于物种间的进化关系进行蛋白质功能预测。它提供了蛋白质家族、功能注释和进化关系的信息,用于研究蛋白质功能和进化。
14、PROSITE数据库
☑️网址:https://prosite.expasy.org/
PROSITE是一个蛋白质结构域和模体数据库,用于识别蛋白质序列中的结构域和模体。它基于序列模式和保守模体进行蛋白质序列的注释和功能预测。
15、BioGRID数据库
☑️网址:https://thebiogrid.org/
BioGRID是一个生物网格数据库,收集了蛋白质相互作用的实验验证数据。它提供了蛋白质相互作用网络的数据和分析工具,用于研究蛋白质相互作用和信号通路。
16、PhosphoSitePlus数据库
☑️网址:https://www.phosphosite.org/
PhosphoSitePlus数据库是一个由 CST 和 NIH 联合开发的免费资源数据库,总结归纳了海量通过科学研究发现的蛋白修饰位点,包括磷酸化、甲基化、乙酰化、泛素化等,并且包括一些 CST 公司发现但未发表的蛋白修饰位点。该数据库是动态的、开放的、高度互动并持续更新的。它有助于研究 PTMs 在正常和病理细胞/组织中的作用,同时它也是发现新的疾病标志物和药物靶点的有力工具。
17、The Human Protein Atlas数据库
☑️网址:https://www.proteinatlas.org/
The Human Protein Atlas内含近30000种人类蛋白质的组织和细胞分布信息,检查每一种蛋白质在人类48种正常组织,20种肿瘤组织,47个细胞系和12种血液细胞内的分布和表达,其结果用至少576张免疫组化染色图表示,并经专业人员校对和标引,保证染色结果具有充分的代表性。
上面是整理好分享给大家的蛋白质数据库,有了数据库的数据那就当然离不开一些工具来辅助处理🙋🏻,下面给大家分享几个数据库以外的处理工具吧👏!
01、SignalP 6.0
☑️网址:
https://services.healthtech.dtu.dk/services/SignalP-6.0/
SignalP是目前应用最广泛的氨基酸序列信号肽在线预测工具。最新的版本是SignalP 6.0,预测方法基于多种人工神经网络算法,可预测细菌和真核生物氨基酸序列中的信号肽切割位点。
02、YLoc
☑️网址:
https://abi-services.cs.uni-tuebingen.de/yloc/webloc.cgi
YLoc是一个用于蛋白质亚细胞定位预测的在线工具。除了预测位置外,YLoc还给出了为何如此预测以及蛋白质序列的哪些生物特性导致了此预测结果。
03、Cell-PLoc
☑️网址:
http://www.csbio.sjtu.edu.cn/bioinf/Cell-PLoc-2/
Cell-PLoc是上海交通大学模式识别与生物信息学研究组开发的众多在线工具中的一个,主要用于预测不同生物体中蛋白质的亚细胞定位。
04、IBS
☑️网址:http://ibs.biocuckoo.org/
IBS 是一个绘制基因蛋白序列结构示意图的在线工具,如果不知道如何动手绘制的时候,可参考示例文件的样式进行绘制。
05、ESPript
☑️网址:https://espript.ibcp.fr/ESPript/cgi-bin/ESPript.cgi
ESPript是一款免费的用于对位序列展示的在线工具,除了可以显示序列的保守区域,还可以添加蛋白的二级结构,除了支持高dpi的PNG和TIFF格式图片下载,还支持下载PDF格式的矢量图,重点是配色和样式非常漂亮!
06、Jalview
☑️网址:https://www.jalview.org/
Jalview是一款免费的多序列比对可视化与编辑分析软件,可用它来查看和编辑对位后的序列,也可进行相关的系统发育分析和主成分分析,甚至检查分子结构和注释。通过File菜单下的Input Alignment/From File,可上传本地对位文件进行可视化,而Jalview支持的配色方案也非常多!
07、Phyre2
☑️网址:
http://www.sbg.bio.ic.ac.uk/phyre2/html/page.cgi?id=index
Phyre2是一个可以对蛋白结构、功能和变异进行预测和分析的在线工具,Phyre2是Phyre的升级版本,主要使用远程同源检测的方法进行3D建模,预测配体结合位点和氨基酸变异影响。