生物信息学的发展阶段大致可以化为以下三个阶段[1]:
(1) 前基因组时代(1990 年之前):在这一阶段主要建立生物信息序列比较算 法和生物数据库等,为生物信息学的发展奠定了基础。
(2) 基因组时代(1990 年至 2001 年):在这一阶段计算机技术和网络技术得 到极大发展,生物信息学领域主要通过计算机网络建立大规模的在线生物 信息数据库系统,为进行庞大的基因组识别与测序提供技术上的支持。
(3) 后基因组时代(2001 年至今): 随着数目庞大的模式生物基因组测序的 完成,生物信息学的发展已经进入后基因组时代,基因组学研究的研究重 点转向基因的功能,这种转变产生了功能基因组学。
现阶段基因组学和蛋白质组学成为了生物信息学领域的重点研究方向[2,3],其中 基因组学方面的研究主要包括比较基因组学的研究、结构基因组学的研究、功能基因 组学的研究、药物基因组学的研究和环境基因组学的研究,蛋白质组学方面的研究主 要包括蛋白质的结构与功能的研究和蛋白质分子作用途径及其相互作用的研究。
生物信息学的应用十分广泛,在生物科学, 临床医药等领域[2],生物信息学的应 用前景和作用正扮演着越来越重要的角色。生物信息学应用最为广泛的领域是生物科 学,在基因的表达与分析,蛋白质结构和功能的分析与预测等方面依靠生物信息学的
研究成果发展的非常快。另外一个生物信息学应用广泛的产业是临床医学和药物,人 类的很多疾病大多与基因遗传有关,生物信息学可以通过对基因序列的分析,预估各 种疾病的发生率;在药物产业方面,传统药物行业改变了原先制造新药的途径,利用 生物信息学技术和成果合成新药,因此生物信息学在临床医学和药物方面起到了非常 重要的作用。在工业和农业领域,生物信息学也慢慢渗透进来,基因工程疫苗和药物、 大规模的植物基因改造工程,使得农业和工业发展地尤为迅速。
1。1。2 机器学习
机器学习相关的研究始于上世纪 50 年代左右。研究人员从仿生学受到启发,希 望机器能像人类的大脑和神经网络那样去工作。上世纪 50 年代 F。Rosenblartt 创历史 地提出了第一个叫做感知器的学习机器模型[3],这在人工智能领域内具有划时代的意 义。F。Rosenblartt 通过计算机程序把学习机器模型表示出来,这个程序的实验结果证 明了证明了 F。Rosenblartt 的理论猜想——叫做感知器的机器学习模型具有学习能力。 此外,在 20 世纪 60 年代中期,Novikoff 从理论上证明了关于感知器的重要定理。这 一定理在创建学习理论中扮演了十分重要的角色,也是机器学习的开端。
机器学习最终目标是实现人工智能。机器学习运用到了概率和统计等多学科的知 识,是一门强大的交叉学科。机器学习的根本目的在于使计算机机器能模拟人的学习 行为和大脑神经网络的工作模式, 这样能使计算机机器通过自身的学习与积累不断
获取所需的知识, 不断完善其性能。如今,在计算机大领域下各种算法和硬件得到了
极大的进步与发展,机器学习在人工智能领域的重要性不断被科研人员发掘,目前机 器学习的主要研究重点为面向任务的研究、认知模型和理论分析[4]。
机器学习发展了这么久,到目前为止应用广泛的机器学习算法数目已经非常多了, 主流的机器学习算法通过学习方式加以分类,可以分为监督学习和非监督学习两大类, 监督学习算法主要包括线性回归、神经网络、逻辑回归和支持向量机;非监督学习算 法主要包括聚类算法和降维算法。近些年来,随着计算机硬件与人工智能的极大发展, 机器学习在越来越多的与我们生活息息相关的领域应用开来,如语音识别、搜索引擎、 天气预报、图像处理等等[5,6]。 基于SVM的核小体位置预测(3):http://www.youerw.com/jisuanji/lunwen_96582.html