摘要:針對前饋神經(jīng)網(wǎng)絡(luò)難以處理時序數(shù)據(jù)的問題,提出將雙向循環(huán)神經(jīng)網(wǎng)絡(luò)(BiRNN)應(yīng)用在自動語音識別聲學(xué)建模中。首先,應(yīng)用梅爾頻率倒譜系數(shù)進行特征提取;其次,采用雙向循環(huán)神經(jīng)網(wǎng)絡(luò)作為聲學(xué)模型;最后,測試不同參數(shù)對系統(tǒng)性能的影響。在TIMIT數(shù)據(jù)集上的實驗結(jié)果表明,與基于卷積神經(jīng)網(wǎng)絡(luò)和深度神經(jīng)網(wǎng)絡(luò)的聲學(xué)模型相比,識別率分別提升了1.3%和4.0%,說明基于雙向循環(huán)神經(jīng)網(wǎng)絡(luò)的聲學(xué)模型具有更好的性能。
注:因版權(quán)方要求,不能公開全文,如需全文,請咨詢雜志社。
計算機與現(xiàn)代化雜志, 月刊,本刊重視學(xué)術(shù)導(dǎo)向,堅持科學(xué)性、學(xué)術(shù)性、先進性、創(chuàng)新性,刊載內(nèi)容涉及的欄目:算法設(shè)計與分析、數(shù)據(jù)庫與數(shù)據(jù)挖掘、軟件工程、操作系統(tǒng)、人工智能、圖像處理、計算機仿真、計算機控制、網(wǎng)絡(luò)與通信、信息安全、電子商務(wù)、計算機輔助設(shè)計、計算機輔助教學(xué)、信息系統(tǒng)與ERP、中文信息技術(shù)、多媒體技術(shù)、農(nóng)村信息化技術(shù)、應(yīng)用與開發(fā)等等。于1985年經(jīng)新聞總署批準的正規(guī)刊物。