第31卷第1期2001年1月数学的实践与认识MATHEMATICSINPRACTICEANDTHEORYVol131No11Jan.2001任意选出比较多的(为了保证较高的准确性),利用keyword作为分类标准,然后利用本文提供的加权系数的确定方法就可以定出一个具体的定量标准.具有一定实用价值.参考文献:[1]李涛,贺勇军等.MATLAB工具箱应用指南——应用数学篇.电子工业出版社1[2]袁亚湘.最优化方法.科学出版社1[3]张乃孝,裘宗燕.数据结构——c++与面向对象的途径.高教出版社1[4]汪仁官.概率论引论.北京大学出版社1[5]陈家鼎,孙山泽等.数理统计学讲义.高教出版社1TheGroupingofDNASequencesModelYANGJian,WANGChi,YANGYong(PekingUniversity,Beijing100871)Abstract:Inthispaper,amethodtoclassifytheDNAsequencesisproposed.Mathematicalmethodssuchasstatisticsandoptimizationareusedtobuildthemodel.Thedataisanalysedsufficientlyandthe“criticalwords”isgot,whichcanrepresentthecharacteristicsofeachgroup.Accordingtothis,aquantitativestandardforgroupingisbroughtforward.Thismodelcanproperlyclassifythegivendatathroughtesting.First,thestringswhichappearrepeatedly(calledwords)inthegivendataarescannedout.Thestandardfrequencyanddispersionforeachwordarecalculated.Second,usingtheLeastSquaresmethod,thepriorityfunctionisfixed.Throughstepwiseoptimization,thecoefficientsaremadestable.Third,thekeywordsareselectedoutandcalculatetheweightaccordingtothepriorityfunction.Atlast,usingthe“analysehierarchyprocess”,theundetermineddataisclassified.Thismethodcanclassifytheundetermineddata(No.21—No.40)fairlywell,itcanalsogivegoodresultforthelast182sequences.DNA序列的分类韩轶平,余杭,刘威指导老师:杨启帆(浙江大学,杭州310027)编者按:本文借助于计算机符号处理的能力来把握序列中不同碱基的丰度特征,从而进行了利用数理统计方法的分类研究.而后引入相关度分类判别算法及反馈机制来比较碱基的相对位置,在既定方向上颇具新意地把工作推向深入.不足之处在于,未能使用相关度工具对各类样本分别进行分析;此外,“纯数学”必须与其他学科紧密结合才会有优秀的建模工作,本文虽然对编码氨基酸的三联体进行初步探讨,着墨处自是轻淡许多.©1994-2008ChinaAcademicJournalElectronicPublishingHouse.Allrightsreserved.http://www.cnki.net摘要:本文对A题中...