虽然以上罗列并不完全,但却绘出了说话人识别的基本应用类型和一些典型应用。由于与其他生物识别技术相比,说话人识别具有更为简便、准确、经济及可扩展性良好等众多优势,故其具有广泛的应用前景。

1.3 本论文的主要工作

正因为语音如此重要,那对语音的识别也就迫不及待了。前人已经对语音识别做了大量的研究,得到了许多理论和实践知识。说话人识别系统的两个关键部分是特征提取和模式匹配。这篇论文中,将针对说话人识别,采用VQ算法,讲述了VQ算法的基本原理和算法实现。主要选用LBG算法来讨论如何实现对的说话人进行识别的问题。同时借助MATLAB软件,对其进行了编程和调试,并达到了预期的结果。

2. 说话人识别技术概述

说话人识别可以看作是语音识别的一种。它和语音识别一样,都是通过对所收到的语音信号进行处理,提取相应的特征或者建立起相应的模型,然后据此做出判断。说话人识别与语音识别的区别在于,它并不注意语音信号中的语义内容,而是希望从语音信号中提取出人的特征。从这点上说,说话人识别是企图挖掘出包含在语音信号中的个性因素,而语音识别是企图从不同人的词语信号中寻找共同因素。在处理方法上,说话人识别力图强调不同人之间的差别,而语音识别则力图对不同人说话的差别加以归一化。说话入识别(Speaker Recognition)又可以分为两个范畴,即说话入辨认(speaker Identification)和说话人确认(Speaker Veriflcation)。前者是把未标记的语句判定属于N个参考说话人之中的某一个所说,是一个多者择一的问题。后者则是根据说话人的语句确定是否与其所声言的参考说话人相符,这种确认只有二种可能,或是肯定(即得到确认),或是否定(拒绝承认)。本质上讲,说话人识别是一个语音信号模式识别问题,它由训练和识别两个过程完成。提取说话人特征的过程称为训练过程,根据待识语音对说话人身份做出判断称为识别过程。训练过程是从某一说话人大量语音信号中提取出该说话人的个人特征,并形成参考模式。识别过程是从待识语音中提取特征形成待识模式,与参考模式进行比较和判决,从而确定说话人身份。

2

2.1 说话人识别的原理

    说话人识别就是从说话人的一段语音中提取出说话人的个性特征,通过对这些个人特征的分析和识别,从而达到对说话人进行辨别或者确认的目的。说话人识别不同于一般的语音(说话内容)的识别,前者利用的是语音信号中说话人的个性特征,不考虑包含在语音中的字词的含义,强调的是说话人的个性;而后者的目的是识别出语音信号中的语义内容,并不考虑说话人的个性,强调的是语音的共性。下图(如图3.1)是说话人识别的结构框图,它由处理,特征提取、模式匹配和判决等几部分组成。除此之外,完整的说话人识别系统应包括模式训练和判决阀值选择等部分。

    说话人识别系统框图

建立和应用一个说话人识别系统可分为两个阶段,即训练(注册)阶段和识别阶段。在训练阶段,系统的每一个使用者说出若干训练语料,系统根据这些训练语料,通过训练学习建立每个使用者的模板或模型参数参考集。而在识别阶段,把从待识别说话人说出的语音信号中提取的特征参数,与训练过程中得到的参考参量及模板模型加以比较,并且根据一定的相似性准则进行判定;对于说话人辨认来说,所提取的参数要与训练过程的每一人的参考模型加以比较,并把与距离最近的那个参考模型所对应的使用者便认为是发出输入语音的说话者。对于说话辨认而言,则是将从输入语音中导出的特征参数与其声音为某人的参考量相比较。如果两者的距离小于规定的阀值,则予以确认,否或则予以拒绝[7]。

上一篇:ADS的Ku波段二倍频的研究
下一篇:Matlab语音识别特征参数LPCC和MFCC研究+程序

基于Java的串口通信设计

基于Kinect的深度图像编码

基于混沌的数字图像加密技术研究

基于Virtex-5FPGA的图像处理系统研究

基于移动通信的工业生产线状态监测技术研究

基于TF/IDF特征的网络问题自动分类研究

基于坐标变换方法的隐身...

张洁小说《无字》中的女性意识

安康汉江网讯

网络语言“XX体”研究

麦秸秆还田和沼液灌溉对...

新課改下小學语文洧效阅...

ASP.net+sqlserver企业设备管理系统设计与开发

互联网教育”变革路径研究进展【7972字】

LiMn1-xFexPO4正极材料合成及充放电性能研究

我国风险投资的发展现状问题及对策分析

老年2型糖尿病患者运动疗...