蛋白质组学和生物信息学年鉴

研究文章

在网上淡水鱼习题和同源性建模的分析与表征

Rumpi Ghosh,Ad Upadhayay和Ak Roy*

印度特里普拉,伦布切拉,印度农业大学(一)渔业学院生物信息学中心

*通讯地址:AK Roy博士,渔业学院生物信息学中心,CAU(I),Lembucherra,Tripura,印度,电子邮件:akroy1946@yahoo.co.in

日期:提交:2017年9月21日;得到正式认可的:2017年10月10日;发布:2017年10月11日

如何引用这篇文章:Ghosh R, Upadhayay AD, Roy AK。在网上淡水鱼atp酶的分析和表征及同源性建模。Ann Proteom Bioinform. 2017;1: 018 - 024。DOI:10.29328 / journal.hpbr.1001003

版权:©2017 Ghosh R等人。这是在Creative必威体育西汉姆联 Commons归因许可下分发的开放式访问文章,其允许在任何介质中不受限制使用,分发和再现,只要原始工作被正确引用。

关键词:ATP酶;expasy的prot;物理化学表征;群主W;建模等

抽象的

atp酶在生物体的许多生物活动中起着至关重要的作用。本研究利用生物化学方法对鱼类atp酶蛋白的理化性质和模型进行了分析在网上的方法。atp酶是一种从鱼类中选择的蛋白质,包括金鱼(Carassius auratus auratus),斑马鱼(Hypancistrus斑马)、白鱼(秋葵),草鲤鱼(Ctenopharyngodon idella) 和Anabas Testudineus.(KOI)用于本研究。物理化学特性显示分子量(25045.58-25148.57DA),理论等电点(9.30-9.97),消光系数(26470-34950),脂族指数(147.31-150.35),不稳定指数(32.84-42.67),负数电荷的残留物和带正电荷的残留物(5/7-6 / 8),以及水仔病的大平均水平(1.014-1.151)。所有蛋白质均被归类为跨膜蛋白。在二次结构预测中,所有蛋白质由随机线圈组成为主要的,其次是延长的股线,α螺旋和β转。预测蛋白质的三维结构并被验证为良好的结构。根据结构评估和立体化学分析,评估所有模型结构。

介绍

ATP bases水解ATP的酶;特别是:水解ATP至ADP和无机磷酸盐的一种,也称为腺苷三磷酸酶。ATP酶的医学定义是水解ATP的酶;跨膜ATP酶是使用ATP水解的膜结合的酶复合物/离子转运蛋白,以驱动穿过膜的质子的转运。一些跨膜ATPAse也在反向上工作,利用膜穿过膜穿过膜的通量来利用质子梯度来驱动ATP的合成。There are several different types of transmembrane ATPases, which can differ in function (ATP hydrolysis and/or synthesis), structure (e.g., F-, V- and A-ATPases, which contain rotary motors) and in the type of ions they transport. The different types include: F-ATPases (ATP syntheses, F1F0-ATPases), which are found in mitochondria, chloroplasts and bacterial plasma membranes where they are the prime producers of ATP, using the proton gradient generated by oxidative phosphorylation (mitochondria) or photosynthesis (chloroplasts). V-ATPases (V1V0-ATPases), which are primarily found in eukaryotes and they function as proton pumps that acidify intracellular compartments and, in some cases, transport protons across the plasma membrane. They are also found in bacteria. A-ATPases (A1A0-ATPases), which are found in Archaea and function like F-ATPases, though with respect to their structure and some inhibitor responses, A-ATPases are more closely related to the V-ATPases-ATPases (E1E2-ATPases), which are found in bacteria and in eukaryotic plasma membranes and organelles, and function to transport a variety of different ions across membranes’-ATPases, which are cell-surface enzymes that hydrolyse a range of NTPs, including extracellular ATP. F-ATPases (also known as ATP Synthase, F1F0-ATPase, or H (+)-transporting two-sector ATPase) are composed of two linked complexes: the F1 ATPase complex is the catalytic core and is composed of 5 subunits (alpha, beta, gamma, delta, epsilon), while the F0 ATPase complex is the membrane-embedded proton channel that is composed of at least 3 subunits (A-C), with additional subunits in mitochondria. Both the F1 and F0 complexes are rotary motors that are coupled back-to-back. In the F1 complex, the central gamma subunit forms the rotor inside the cylinder made of the alpha (3) beta (3) subunits, while in the F0 complex, the ring-shaped C subunits forms the rotor. These ATPases can also work in reverse in bacteria, hydrolyzing ATP to create a proton gradient.

材料和方法

获得蛋白质序列并进行分析

不同鱼类的ATP合酶F0蛋白,包括金鱼(Carassius auratus auratus加入不。-AEH99465.1),Hypancistrus斑马(注册号APF31803.1),秋葵(注册号:ABO14995.1),Ctenopharyngodon idella(加入号码 - ALS20290.1),Anabas Testudineus.以FASTA格式从NCBI蛋白质数据库(http://www.NCBI.nlm.nih.gov)检索(登录号-AQT00813.1)进行分析。上述获得的序列进一步用于完整的蛋白质分析(结构和功能注释)和使用比较建模方法建立模型。使用expasy的protparam服务器(http://expasy.org/cgi-bin/protparam)已完成完整的一级结构分析。SOPMA用于蛋白质序列的二级结构预测。

序列比对

使用clustalW2服务器(http://www.ebi.ac.uk/tools/msa/clustalW2/)对来自不同鱼类的线粒体ATP酶序列进行多序列比对。还使用Clustal omega[1-3]生成蛋白质序列的邻接系统发育分析.Clustal W2是一个用于多序列比对的服务器,也用于系统发育树分析。Phylip和mega也可用于系统发育树分析服务器。

生化的特性

蛋白质的理化性质,如分子量(molt . wt.)、氨基酸组成、理论等电点(pI)、阳性(Arg+Lys)和阴性(Asp+Glu)残基总数(+R/-R)、消光系数(EC)、不稳定性指数(AI)、通过在Expasy的protparam服务器(http://web.expasy.org/protparam/)上搜索,分析了所研究蛋白的大平均水pathicity (GRAVY)。对于域结构,使用了简单的分子结构研究工具(SMART)程序(http:/ SMART . emble -heidelberg.de/)。主要结构分析,作为expasy的protparam服务器。

功能分析

服务器SOSUI(Hirokawa等人)被用来识别蛋白质的类型(http://linux1.softberry.com)用于预测二硫键的存在或不存在及其键合模式,这对定义蛋白质的功能连接和稳定性至关重要。因此,CYS_REC用于确定胱氨酸键的存在或不存在。

蛋白质结构预测

使用SOPMA服务器(http://npsaprabi.ibcp.fr/cgibin/npsa_automat.pI?page=/NPSA/npsa_sopma.html)预测蛋白质的二级结构,使用默认参数(窗宽:17;相似度阈值:8;状态数:[4,5]。利用瑞士模型服务器(http// swismodel .expasy.org/)[6,7]构建同源建模。瑞士模型是一个用于三维结构预测和模板选择的服务器,模板选择是基于最大相似度或与序列的一致性。通过RAMPAGE进行Ramachandran图分析,分析了预测模型的质量和准确性[10,11]。最佳选择模型是基于最有利区域、附加允许区域、慷慨允许区域和不允许区域的总残基数,以及总体g因子在最有利区域和总体g因子的截断值(>-0.5)大于90%的残基数[11,12]。Raptor X也可用于3d结构预测服务器和PSIPRED和GOR IV也可用于二级结构分析服务器免费服务器。用于蛋白质结构预测的服务器还有phyre 2、HHpred、modeler、CPH模型、lomates、Modbase和Robette等。

结果和讨论

物理化学表征

利用Expasy的prot param服务器计算atp酶的氨基酸组成。通过分析Expasy的Protparam工具,获得了蛋白质的物理化学特征(表1)。蛋白质的等电点(pI)的取值范围为9.30-9.97(大于7),这说明了这些蛋白质的基本特征。pI值在蛋白质纯化中起着等电点聚焦于聚丙烯酰胺凝胶的作用。正(Asp+Glu)和负(Arg+Lys)电荷残基(+R/-R)的总数分别为5 ~ 6和7 ~ 8。在280 nm处测定的蛋白质的消光系数(EC)在31970 ~ 34950 M-1之间。Cm-1(假设所有的半胱氨酸残基都来自半胱氨酸)。本研究中ECs的高值意味着沿着蛋白质序列的半胱氨酸浓度较高,这有助于定量定量蛋白质在溶液中的浓度。不稳定性指数(II)值评价蛋白质在试管中的稳定性;建议一个蛋白质在其II值小于40时是稳定的,当这个值大于40时是不稳定的。本研究结果显示,II值蛋白在一个范围内,蛋白质在32.84-42.67之间,表明斑马鱼的蛋白质为(II>40),其余为稳定(II<40)[13-22]。脂肪族指数(AI)是直接与蛋白质中脂肪族侧链(丙氨酸、异亮氨酸、亮氨酸和缬氨酸)的摩尔分数联系在一起,用以估计蛋白质热稳定性的参数。 In this study a high Aliphatic index values of proteins (147.31-150.35) imply high thermo stability of these proteins. Low grand average hydropathicity (GRAVY) regarded as a measure for the stability of globular protein at high temperature. The amino acid composition in ATP Synthase-F0 computed using expasy’s protparam was showed in table 1.

表格1:使用Expasy ProtParam工具计算的参数。
物种 机管局数目 摩尔重量。 PI. + R / -R 电子商务 2 人工智能 肉汁
斑马鱼
227.
25148.57
9.30 6/8
31970.
42.67
149.56
1.014
草鱼 227.
25055.57
9.51 5/7
31970.
32.84
147.31
1.151
Autumnalis
227.
25055.57
9.51
5/7
31970.
32.84
147.31
1.151
金鱼(auratus) 227.
25047.49.
9.30
5/7
34950
33.16
150.35
1.135

Anabas Testudineus.

227. 25045.58 9.97 5/8
26470.
36.10
147.44
1.080

通过SOSUI程序将所有蛋白质分类为跨膜蛋白质。根据蛋白质序列预测的跨膜区域如表2所示。这些膜蛋白质的氨基酸序列有6个跨膜螺旋,除了秋葵有5个跨膜区域。

表:2:利用SOSUI鉴定蛋白质类型和跨膜区域.
物种 蛋白质的类型 长度 跨膜区 N-C终端
草鱼 基本的 23 psflgipliaiaialpwvlfptp. 60-82
次要的 23 WALLLASLMVFLITINMLGLLPY 117-139
基本的 20 slnmgfavplwlatviigmr. 148 - 167
基本的 23 Plipvliiietislfirplalgv. 185 - 207
基本的 23 TAGHLLIQLIATAVFVLLPMMPT 214-236
基本的 23 FLLTLLEVAVAMIQAYVFVLLLS 246-268
斑马鱼 基本的 22 PTFLGIPLIPIALTPWILIPS 55-76
次要的 23 WALILTSLMIFILSLNMLGLLPY 112 - 134
基本的 20 LSLNMGFAVPLWLATIIIGL 142-161
基本的 23 lipvliiietislfirplalgvr. 181-203
次要的 23 HLLIQLISTATFILLPMMTTVAL 212 - 234
基本的 23 ILLTLLEVAVAMIQAYVFVLLLS 241-263
Anabas Testudineus. 基本的 23 PIFLGVPLIALALALPWILFPTP 55-77
次要的 23 wallftslmlflmtlnmlgllpy. 112 - 134
次要的 21 LSLNMAFAVPLWLATVIIGMR 142-162
基本的 23 Plipvliiietisllirplalgv. 180 - 202
基本的 23 iqliataafvllplmpavairta. 215-237
基本的 22 iqliataafvllplmpavairta. 248 - 269
Carassius auratus. 次要的 23 阿斯匹林 57 - 79
次要的 23 walllaslmiflitinmlgllpy. 116 - 138
基本的 20 slnmgfavplwlatviigmr. 147-166
基本的 23 Plipvliiietislfirplalgv. 184-206
基本的 23 TAGHLLIQLIATAVFVLLPMMPT 213-235
基本的 23 FLLTLLEVAVAMIQAYVFVLLLS 245-267
秋葵 次要的 23 IsFmSptylgiplavaltlpwi 47 - 69
基本的 23 MLTSLMLFLITLNMLGLLPYTFT 112 - 134
次要的 21 qlslnmglavpmwlatviigm. 138 - 158
基本的 23 Plipvliiietislfirplalgv. 177 - 199
基本的 23 IATAAFVLLPMMPTVAILTALVL. 215-237
在草鱼总长度:275 A。A.斑马鱼的平均疏水性:0.844728,总长度:270A.平均疏水性:0.754445,Anabas Testudineus.,总长度:270 A. A。,疏水性平均:0.798519,Carassius auratus,总长度:274 A. A。A.,疏水性平均:0.861314,秋葵全长:246a。A.平均疏水性:0.841057。

序列比对

对蛋白进行[1]的多个氨基酸序列比对(图1A,B)。结果表明,5种鱼类的atp酶序列具有较高的相似性;我们观察到柯瑞根与Hypancistrus的相似性更大。利用聚束omega构建了相邻系统发生树。

图1a:鱼类ATP序列序列序列对准和系统发育分析。(a)多序列对齐。星号标记(*),冒号(:),点(。)和划线( - )表明了相同的氨基酸,保守的取代,半保守和缺失。

图1B:一个邻近的系统发育树,显示了ATP酶之间的关系。

功能分析结果

二硫键在蛋白质折叠和稳定性中是显着的,其通过氧化折叠过程在半胱氨酸残基的硫醇基团之间产生。在该研究中,使用Cys_rec服务器测定蛋白质中的半胱氨酸残基。结果表明,任何这些蛋白质不含半胱氨酸残基,并且未发现任何可能的半胱氨酸对(表3),表明没有一种蛋白质含有二硫键[4]。

表3:使用CYC_REC工具预测成对的二硫键模式。
物种 CYS_REC
草鱼
斑马鱼
Anabas Testudineus.
Carassius auratus.
秋葵

在5种鱼类中没有发现CYS_REC。半胱氨酸残基和二硫键是决定蛋白质热稳定性的重要因素。结果表明,这些蛋白质中可能没有二硫化物键。

蛋白质结构预测与验证

使用SOPMA预测来自鱼类的ATPAse蛋白的二次结构(表4)。结果表明,除了草鲤鱼的ATP酶外,均含有α螺旋作为二级结构元素中的主要成分,其次是随机线圈,延长的链和β转。

基于来自PDB的不同可用蛋白质结构模板的序列和结构相似性建模的鱼ATP酶蛋白的三维结构(表4)。用瑞士PDB查看器表示的模型的最终结构如图2所示。表5 [4]表示对Ramachandran地块进行横冲流脉冲的验证和预测模型。

表4:利用SOPMA研究鱼类atp酶的二级结构元件。
元素 草鱼 斑马鱼 Anabas Testudineus. Carassius auratus. 秋葵
α螺旋
310螺旋
π螺旋
β桥
延长的股线
贝加转
弯曲区域
随机线圈
暧昧的国家其他国家
113(49.78%)
0(0.00%)
0(0.00%)
0(0.00%)
36 (15.86%)
7(3.08%)
0(0.00%)
71例(31.28%)
0(0.00%)
0(0.00%)
120例(52.86%)
0(0.00%)
0(0.00%)
0(0.00%)
36 (15.865)
7(3.08%)
0(0.00%)
64例(28.19%)
0(0.00%)
0(0.00%)
125例(55.95%)
0(0.00%)
0(0.00%)
0(0.00%)
29(12.78%)
11(4.85%)
0(0.00%)
60(26.43%)
0(0.00%)
0(0.00%)
111(48.90%)
0(0.00%)
0(0.00%)
0(0.00%)
39 (17.18%)
11(4.85%)
0(0.00%)
66(29.07%)
0(0.00%)
0(0.00%)
92(46.46%)
0(0.00%)
0(0.00%)
0(0.00%)
37(18.69%)
6 (3.03%)
0(0.00%)
63(31.82%)
0(0.00%)
0(0.00%)
表5:使用瑞士模型和Rampage for Ramachandran图分析对鱼类ATP酶蛋白的三维(3-D)结构进行同源性建模。
指数 草鱼 斑马鱼 Anabas Testudineus. Carassius auratus. 秋葵
模板 5 arh.1.v 5ara.1.v. 5ara.1.v. 5 are.1.v 5ara.1.v.
决议(Å) 7.2 7.2 6.7 7.4 6.7
序列标识(%) 62.42 53.49 60.51 55.38 52.31
Q均值 -3.71 -5.68 -3.82 -4.37 5.34
横冲直撞
最有利地区的残留物 4064例(88.8%) 4047例(88.4%) 4047例(88.4%) 4050例(88.5%) 4050例(88.5%)
在宽松允许区域的残基 351(7.7%0 347(7.6%) 347(7.6%)
351(7.7%)
351(7.7%)
外肝区残留 161(3.5%) 182例(4.0%) 182例(4.0%)
175(3.8%)
175(3.8%)

图2:用不同鱼类蛋白质的瑞士PDB观众代表的模型的结构。

通过表4所示的PROCHECK分析,检查了所提出模型的立体化学质量和准确性。分析结果表明,草鱼、斑马鱼、黑鲷的ATP酶预测模型,Anabas Testudineus.,carassius auratus,和秋葵在最有利区域有超过(88%)的残基,表明这些同源模型质量良好,附加的允许区域组合,意味着可接受。结果表明,在最有利区域发现的残基数量分别超过88%(分别为88.8%、88.4%、88.4%、88.5%和88.6%)。超过7%(7.7%,7.6%,7.6%,7.7%,7.7%)的残基在慷慨或额外允许区域,和(3.5,4.0,4.0,3.8,3.8)%的残基在蛋白质的不允许区域。所有的蛋白质模型都包含了低于8%的残留在慷慨允许的区域,这表明可能接近于高质量的模型。Q-mean score value range(-5.68-5.34),结果表明模型被接受。

结论

在这项研究中,我们选择了淡水鱼的五种atp酶蛋白并用计算工具进行表征。深入研究了蛋白质的理化性质和功能特征。将所有蛋白质分类为跨膜蛋白,计算出α螺旋和随机螺旋的数量为主导,其次是所有蛋白质二级结构中的延伸链。利用ramachandran图分析的准确性对蛋白质的三维模型进行预测和验证;结果表明,所提出的模型是可靠和有效的。本研究为鱼类atp酶的理化特性、结构特性和分子功能提供了信息,为进一步研究其特异功能提供了依据。

确认

作者感谢阿加塔拉Lembucherra中央农业大学渔业学院院长的鼓励和支持。印度新德里戈伊市DBT为BIF项目提供的财务援助,本研究正是在该项目下开展的。

参考

  1. 陈国俊,范明德。在网上淡水鱼主要组织相容性复合体IIα的分析。亚太科技杂志。2016;21:1-8。Ref。https://goo.gl/mtfwo3.
  2. 陈玉俊,王贵棠,范明德。硬骨肿瘤坏死因子α:在网上特征与同源性建模。Songklanakarin科学技术。2016;38:549-557。Ref。https://goo.gl/YB3dgD
  3. Tamura K,Stecher G,Peterson D,Filipski A,Kumar S.MEGA6:分子进化遗传学分析版本6.0.分子生物学与进化.2013;30:2725-2729.参考文献:https://goo.gl/PYMja7
  4. Hogg PJ.作为蛋白质功能开关的二硫键.趋势生物化学科学2003;28:210-214.参考文献:https://goo.gl/5EevyN
  5. SOPMA:通过对多个序列的一致预测,在蛋白质二级结构预测方面有了显著的改进。计算机在生物科学中的应用。1995;11: 681 - 684。Ref。https://goo.gl/wUsYbn
  6. Schwede T,Kopp J,Guex N,Peitsch MC。瑞士型号:自动蛋白质同源式服务器。核酸研究。2003;31:3381-3385。Ref。https://goo.gl/MjY825
  7. Arnold K,Bordoli L,Kopp J,Schwede T.瑞士模型工作区:基于网络的蛋白质结构同源性建模环境。生物信息学。2006; 22: 195-201. 裁判。:https://goo.gl/ttxbtk.
  8. 基于模板的蛋白质结构建模。《计算生物学》2010;73 - 94。
  9. FiserA。基于模板的蛋白质结构建模。D Fenyo。计算生物学:Humana出版社;2004.
  10. Ramachandran GN,Ramakrisnan C,Sasisekhran V.果糖链条配置的立体化学。J Mol Biol。1963;7:95-99。Ref。https://goo.gl/BaHh8q
  11. Laskowski Ra,Rullman Jac,Macarthur MW,Kaptein R,Thornton Jm。Aqua和Procheck_nmr:用于检查NMR解决蛋白质结构质量的程序。双模核仁杂志CHINESE。1996年;8:477-486。Ref。https://goo.gl/7emfju.
  12. Ramachandran G,Ramakrishnan C,Sasisekharan V.多肽链配置的立体化学。J Mol Biol。1963;7:95-99。Ref。https://goo.gl/W7vzZ9
  13. Wallner B,Elofsson A.可以纠正蛋白质模型吗?蛋白质科学。2003;12:1073-1086。Ref。https://goo.gl/vrwtw2.
  14. Wiederstein M, Sippl MJ。ProSA-web:用于识别蛋白质三维结构错误的交互式web服务。核酸Res. 2007;35: W407-W410。Ref。https://goo.gl/qftm8.
  15. Sippl MJ。识别蛋白三维结构中的误差。蛋白质:结构,功能和遗传学。1993年;17:355-362。Ref。https://goo.gl/cqfodw.
  16. 王志强,王志强,王志强,等。人偏肺病毒(hMPV)基质蛋白的结构和功能分析。国际高级生命科学杂志。2013;6: 538 - 548。https://goo.gl/GDGdsz
  17. Ghosh R, Upadhayay AD, Roy AK。在网上赤牛卵黄原蛋白的分析、结构建模和磷酸化位点预测。应用生物技术与生物工程杂志。2017;3: 55。
  18. Pradeep N, Anupama A,Vidyashree K, Lakshmi P。在网上工业重要纤维素酶的表征使用计算工具。进步科学与培养。2012;48:14。
  19. Rumpi G,Upadhyay Ad,Roy Ak,Samik A.主要鲤鱼细胞色素C基因的结构分析及法医调查的效用。论法医与犯罪调查杂志。2017;1:103。ref .:https://goo.gl/alvuda.
  20. Tuan TN,WeiMin W,Duc PM.利用分子生物学方法对金枪鱼NK-κB抑制剂α进行表征和同源性建模在网上分析。J SCI开发。2015;13:216-225。Ref。https://goo.gl/gqrkp.
  21. 戈什·R、乌帕达耶·阿德、罗伊·阿克、曼塔·辛格。在网上同源性建模的Danio Rerio(斑马鱼)线粒体Rho GTH酶2蛋白的分析与3D结构预测。Jacobs J Bioinform Proteom。2016;1:006。ref .:https://goo.gl/VPmbwg
  22. Ghosh R, Upadhayay AD, Roy AK。在网上拉布拉巴泥橡胶1蛋白分析。国际科学与工程创新研究杂志。4:136。裁判:https://goo.gl/wmo4w8