103李兰等基于多因素耦合参数拟合蛋白质折叠速率第2期第42卷第2期2023年4月内蒙古工业大学学报(自然科学版)JournalofInnerMongoliaUniversityofTechnology(NaturalScienceEdition)Vol.42No.2Apr.2023文章编号:1001-5167(2023)02-0103-06基于多因素耦合参数拟合蛋白质折叠速率李兰,张颖(内蒙古工业大学理学院,呼和浩特010051)Proteinfoldingratefittingbasedonmulti-factorcoupledparametersLILan,ZHANGYing收稿日期:2022-10-17基金项目:内蒙古自治区自然科学基金项目(2022LHMS03014);内蒙古自治区直属高校基本科研业务费项目(JY20220069)第一作者:李兰(1996—),女,2020级硕士研究生,主要从事生物信息统计计算研究。E-mail:lilan96066@163.com通信作者:张颖(1973—),女,博士,副教授,主要从事计算生物学研究。E-mail:yzhang@imnt.edu.cn(SchoolofScience,InnerMongoliaUniversityofTechnology,Hohhot010051,China)Abstract:Thefourparametersincludingthenumberofregularsecondarystructures,theweightedlong-rangeorderofaminoacidtypes,theradiusofgyrationperunitchainlengthandthenematicorderwereextractedfromthesequenceandstructureofthenativestateoftheprotein.Theseparameterscharacterizethesize,topology,aminoacidcomposition,geometryandtheordereddegreeofsecondarystructurearrangementoftheprotein,respectively.Thefourparameterswerecoupledtogethertoconstructapower-lawdependenceequationbetweenthecouplingparametersandthefoldingrate.Onanexperimentaldatasetcontaining155proteinfoldingrates,theparameterstobedeterminedfortheequationsweredeterminedusingmaximumlikelihoodestimation.Theresultsshowthatthecouplingparameterachievesan80%goodnessoffittothefoldingrateandthat95%oftheproteinfoldingratesarewithin50-foldofthepredictedvalue,andforthefoldingratedataspanningnineordersofmagnitude,thecouplingparametercapturesthemajorfactorsaffectingthefoldingrate.Keywords:proteinfoldingrate;couplingparameter;power-law;maximumlikelihoodestimation摘要:从蛋白质天然态的序列和结构中,提取了规则二级结构数、氨基酸类型加权长程序、单位链长回转半径和向列序等4个参数,这些参数分别表征了蛋白质的大小、拓扑、氨基酸组成、几何形状和规则二级结构排列有序性。将...