毕业论文

打赏
当前位置: 毕业论文 > 自动化 >

基于音频特征的场景检测算法设计与实现

时间:2018-04-10 21:52来源:毕业论文
多媒体信息的数据量急剧增加。如何对这些多媒体信息加以有效的管理,分类成为一项重要的研究课题。音频是一种常见的载体,对其进行数字化的研究分析并进行相关的处理,从而可

摘要随着近年来的信息技术的发展,多媒体信息的数据量急剧增加。如何对这些多媒体信息加以有效的管理,分类成为一项重要的研究课题。音频是一种常见的载体,对其进行数字化的研究分析并进行相关的处理,从而可以帮助人们充分有效地认识客观世界中的声音信息。20899
音频分类和场景分析技术可以通过声音感知周围环境信息,经过进一步处理在大量信息中找到识别的目标。本文主要作了如下工作:
1)考察了音频信息的主要来源,将音频分为静音段,语音段和音乐段三类,设计了音频分类和分割的流程。
2)音频信号特征提取研究分析,通过对音频的响度,音调,过零率等特征进行分析表征音频的时间统计特性。
3)音频信号的分类,经过音频特征检测后的声音按预先设定好的算法进行分类,实现场景检测功能。
关键词  基于内容的音频检测 特征提取 音频分割
毕业论文设计说明书(论文)外文摘要
Title   Audio Feature-Based Scene Detection Algorithm Design     And Implementation                                             
Abstract
With the development of the information technology, dramatic increase have taken place in the amount of data of the multimedia information. How to manage and classify the multimedia information effectively has become an important research topic. The audio is a common carrier in our life, digital analysis and related processes on audio can help people fully understand the voice information in the world.
Audio classification and scene analysis techniques can get the surrounding  environment information by audio, after further processing it can find the object in mass information. This paper have made the following work:
1)     Examine the main source of the audio information and classify the audio into three types: silent segment ,voice segment and music segment. Design the process of the audio classification and segmentation.
2)    Extract and analysis the audio signal feature :show the time statistical properties of the audio by analyzing the loudness, tone and zero-cross rate.
3)    Classify the audio signal: use the designed algorithm to classify the voice that has been character detected to realize the scene detection function.
Keywords  scene detection; feature extraction; audio classification and segmentation
 目  次
1  引言    1
1.1    研究问题的提出    1
1.2  音频分类和场景分析技术的发展现状    1
1.3    本论文主要研究的问题和论文结构    2
2  音频信号数字化与时频域特征分析    3
2.1 音频信号数字化    3
2.2 时域特征分析    4
2.2.1 短时能量    4
2.2.2 短时平均过零率    4
2.2.3 短时自相关函数和短时平均幅度差函数    5
2.3 频域分析    5
2.3.1 傅里叶变换    5
2.3.2 离散余弦变换    6
2.3.3 线性预测分析    6
3  常见的音频编码格式    7
3.1 音频编码简介    7
3.2 WAV格式    7
3.3 MP3格式    8
3.4 MIDI格式    8
4  音频分类和场景检测    9
4.1 音频分类    9
4.1.1 基于帧的特征分析    9 基于音频特征的场景检测算法设计与实现:http://www.youerw.com/zidonghua/lunwen_12853.html
------分隔线----------------------------
推荐内容