基于混合卷積神經(jīng)網(wǎng)絡(luò)模型的音頻場景分類
【文章頁數(shù)】:62 頁
【學位級別】:碩士
【部分圖文】:
圖2.1音頻場景分類基本原理
內(nèi)蒙古科技大學碩士學位論文-9-2音頻場景分類理論基礎(chǔ)本章2.1節(jié)主要介紹了音頻場景分類問題的基本流程,主要對音頻信號進行預(yù)處理,預(yù)處理之后進行特征提取,提取到的特征由神經(jīng)網(wǎng)絡(luò)模型進行訓練和分類。2.2節(jié)介紹了音頻預(yù)處理的過程,預(yù)處理是對音頻信號進行預(yù)加重、分幀和加窗操作。2.3....
圖2.2幀長和幀移
內(nèi)蒙古科技大學碩士學位論文-11-圖2.2幀長和幀移2.2.3加窗通過分幀將音頻信號分成每一幀信號,每一幀信號兩端將丟失一些信息,音頻信息不再根據(jù)時間連續(xù)音頻信息內(nèi)容,分幀的操作越多,越容易丟失音頻信息,不能很好的表達音頻特性,通過引入窗函數(shù)與幀信號進行相乘,使分幀之后的幀信號內(nèi)....
圖2.3梅爾聲譜圖提取過程
內(nèi)蒙古科技大學碩士學位論文-12-就會降低。對于音頻場景分類加窗函數(shù)選取漢明窗,采用漢明窗的函數(shù)使頻譜來變得光滑,有利于表達音頻的特性。2.3特征提取音頻場景分類系統(tǒng)模型中,特征提取是重要的一步,決定了能不能準確有效的提取出音頻信號的特性。不同的音頻信號提取的特征要有很大的音頻信....
圖3.1CNN網(wǎng)絡(luò)結(jié)構(gòu)
內(nèi)蒙古科技大學碩士學位論文-19-3基于CNN的音頻場景分類本章3.1節(jié)主要介紹基于CNN的基本原理與學習過程,對卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)進行分析。3.2節(jié)主要進行Mel聲譜圖和MFCC特征提取,得到城市音頻數(shù)據(jù)集的特征圖,在相同卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)和參數(shù)下對這兩種特征提取方式進行對比實驗,....
本文編號:4038931
本文鏈接:http://www.lk138.cn/shoufeilunwen/xixikjs/4038931.html
下一篇:沒有了