当前位置:墨水屋 >

学习经验 >论文提纲 >

蛋白质序列的并行分类方法研究论文提纲

蛋白质序列的并行分类方法研究论文提纲

蛋白质序列的并行分类方法研究论文提纲

   论文摘要: 本论文的主要研究对象是生物信息学中的蛋白质序列分类问题.利用计算的方法,从蛋白质的一级序列决定了其三维(略)发,针对氨基酸序列建立数学模型进行蛋白质结构分类,并引入并行计算的思想提高分类器性能.用并行计算方法进行蛋白质序列的结构分类减少了昂贵且非常耗时的实验次数,提高了分类效率,促进了对复杂的生物规律(略)用生物信息的提取. 本文在当前准确性最高的基于判别模型的蛋白质远同源检测算法的基础上,结合基于统计剖面的生成模型方法,设计了基于统计剖面的核函数.并通过半监督学习的方法提高了远同源检测算法的准确性.针对蛋白质序列分类中正样本数远小于负样本数,造成(略)练不平衡的问题,本文提出了优化支持向量机算法,对正类样本集和负类样本集应用不同的惩罚参数,(略)本.对给定测试集进行的`预测实验结果表明本文的算法取得了优于其它远同源检测算法的预测效果. 针对标准支持向量机算法只能分别对每一个蛋白质结构类进行二元判别的问题,本文引入了多类支持向(略)元SVM分类器的判别结果进行综合,输出唯一的蛋白质结构类预测结果,提高了基于支持向量机的蛋白质序列分类的可用性.多类支持向量机需要复杂的计算...
    In this paper, the main research object is th(omitted)sequence classific(omitted)lem in bioinformatics. We use the method of calculation, from th(omitted)nt of the protein’s amino acid sequences determined the three-dimensional structure, to establis(omitted)ical model and construct an appropriate optimization algorithm to solve the protein sequence classification problem. Using the method of calculating in protein sequence classification could reduce the number of experiment (omitted)ery time-consumin...
目录:中文摘要 第3-4页
ABSTRACT 第4-5页
第1章 绪论 第9-18页
  ·引言 第9-10页
  ·研究背景 第10-15页
    ·蛋白质序列与结构 第10-12页
    ·蛋白质分类的国内外进展 第12-15页
  ·本文主要研究工作与创新点 第15-16页
  ·论文结构 第16-18页
第2章 远同源检测算法与支持向量机理论 第18-32页
  ·双序列比对算法 第18-23页
    ·全局比对算法 第20-21页
    ·局部比对算法 第21-22页
    ·启发式算法 第22-23页
  ·基于统计剖面的生成模型 第23-25页
  ·基于判别模型的远同源检测 第25-26页
  ·支持向量机理论 第26-31页
    ·最大边缘超平面 第26-27页
    ·结构风险最小化 第27页
    ·支持向量机 第27-31页
  ·小结 第31-32页
第3章 基于远同源检测的蛋白质序列分类 第32-48页
  ·核技术与核函数 第32-33页
  ·剖面内核的蛋白质远同源检测算法 第33-41页
    ·基于统计剖面的核函数 第34-36页
    ·半监督学习分析 第36-37页
    ·基于树的内核矩阵 第37-38页
    ·优化支持向量机 第38-41页
  ·数据集 第41-43页
    ·数据集的选取 第41页
    ·数据集的构建 第41-43页
  ·实验与分析 第43-47页
    ·算法性能评估指标 第43-45页
    ·实验环境 第45页

  • 文章版权属于文章作者所有,转载请注明 https://www.moshuiwu.com/lwtgjy/o5z867.html