農(nóng)產(chǎn)品市場(chǎng)信息采集的語音識(shí)別魯棒性方法研究
當(dāng)前語音識(shí)別的研究已取得了較為豐碩的成果,在安靜環(huán)境下性能令人滿意,逐漸被應(yīng)用在諸多人機(jī)交互的場(chǎng)合。然而,由于噪聲的存在,語音識(shí)別系統(tǒng)在實(shí)際環(huán)境下性能急劇下降,如何提高語音識(shí)別的噪聲魯棒性,逐漸成為近年來語音識(shí)別的研究熱點(diǎn)。本文主要研究農(nóng)產(chǎn)品市場(chǎng)信息采集作業(yè)環(huán)境中的語音識(shí)別噪聲魯棒性問題,針對(duì)當(dāng)前缺乏面向農(nóng)產(chǎn)品市場(chǎng)信息采集領(lǐng)域的語音識(shí)別引擎,而通用領(lǐng)域的識(shí)別算法又不適合解決上述問題,分析環(huán)境的噪聲特點(diǎn),面向非特定人和中小規(guī)模詞匯量的連續(xù)漢語普通話識(shí)別,訓(xùn)練聲學(xué)模型,研究適用于該環(huán)境下的語音識(shí)別魯棒性方法。本文主要研究的內(nèi)容包括:(1)基于隱馬爾科夫模型(HMM)框架建立了聲學(xué)模型,利用自建的農(nóng)產(chǎn)品市場(chǎng)信息語料庫進(jìn)行訓(xùn)練和測(cè)試HHM模型,基于HTK工具包建立了農(nóng)產(chǎn)品價(jià)格語音識(shí)別基線系統(tǒng)。(2)在分析農(nóng)產(chǎn)品市場(chǎng)信息采集環(huán)境的噪聲特點(diǎn)的基礎(chǔ)上,從模型空間和特征空間對(duì)系統(tǒng)采取了多種魯棒性方法,包括:在聲學(xué)模型的識(shí)別基元選取上,采用了一種擴(kuò)展的三音素聲韻母模型,有效的解決了音節(jié)內(nèi)部和音節(jié)間的協(xié)同發(fā)音問題,大大提高了識(shí)別率;針對(duì)建模后三音子模型數(shù)量急劇增加問題,采用了決策樹狀態(tài)聚類方法,建立了一套二值問題規(guī)則集,并將語音學(xué)的專業(yè)知識(shí)融合進(jìn)決策樹,通過聚類減少了三音子模型的數(shù)量,有效地解決了訓(xùn)練數(shù)據(jù)不充分問題;鑒于倒譜均值歸一化(CMN)方法在消除信道卷積噪聲以及加性噪聲方面的良好表現(xiàn),在農(nóng)產(chǎn)品市場(chǎng)信息語音識(shí)別系統(tǒng)中采用,有效緩解了信道噪聲影響。(3)在信號(hào)空間,為了提高輸入語音信號(hào)的信噪比,采用了譜減類算法進(jìn)行語音增強(qiáng),但譜減算法容易帶來信道失真和“音樂”噪聲。為了減少這種失真,提出了一種聯(lián)合語音增強(qiáng)與特征補(bǔ)償?shù)聂敯粜苑椒?把倒譜均值方差歸一化方法(CMVN)與譜減類算法進(jìn)行了結(jié)合,二者互為補(bǔ)充。實(shí)驗(yàn)結(jié)果表明,聯(lián)合后的算法能有效提高系統(tǒng)的識(shí)別率,特別是在低信噪比時(shí)效果更為明顯。(4)在統(tǒng)計(jì)估計(jì)理論的框架下,研究了估計(jì)幅度與實(shí)際幅度的最小均方誤差(MMSE)估計(jì)器以及對(duì)數(shù)最小均方誤差(log MMSE)幅度估計(jì)器。在此基礎(chǔ)上提出了一種聯(lián)合MMSE以及l(fā)og MMSE幅度估計(jì)與CMVN失真補(bǔ)償?shù)聂敯粜苑椒。不同農(nóng)產(chǎn)品市場(chǎng)信息采集環(huán)境下的實(shí)驗(yàn)證明,該方法具有一定的噪聲魯棒性,多種空間算法的有機(jī)結(jié)合可以提供系統(tǒng)的魯棒性,特別是在低信噪比時(shí)更為明顯。本文的研究為語音識(shí)別在農(nóng)產(chǎn)品市場(chǎng)信息采集環(huán)境中的應(yīng)用建立了一套魯棒性方法,為今后語音識(shí)別在農(nóng)業(yè)信息采集領(lǐng)域的應(yīng)用提供了借鑒。
【學(xué)位授予單位】:中國(guó)農(nóng)業(yè)科學(xué)院
【學(xué)位授予年份】:2015
【分類號(hào)】:TN912.34
【目錄】:
【參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫 前10條
1 王易川;李智忠;;基于Mel倒譜和BP神經(jīng)網(wǎng)絡(luò)的船舶目標(biāo)分類研究[J];傳感器與微系統(tǒng);2011年06期
2 郭海燕;楊震;朱衛(wèi)平;;一種新的基于稀疏分解的單通道混合語音分離方法[J];電子學(xué)報(bào);2012年04期
3 白立舜;楊伯鋼;王晴;;森林資源調(diào)查的便攜式野外聲控記錄技術(shù)研究[J];測(cè)繪通報(bào);2013年09期
4 張雪英;賈海蓉;靳晨升;;子空間與維納濾波相結(jié)合的語音增強(qiáng)方法[J];計(jì)算機(jī)工程與應(yīng)用;2011年14期
5 劉放軍;王仁華;;語音識(shí)別前端魯棒性問題綜述[J];計(jì)算機(jī)科學(xué);2006年04期
6 王讓定,柴佩琪;語音倒譜特征的研究[J];計(jì)算機(jī)工程;2003年13期
7 舒挺,張國(guó)煊;基于Voice XML技術(shù)的信息服務(wù)集成[J];計(jì)算機(jī)應(yīng)用;2003年06期
8 王曉蘭,周獻(xiàn)中;格式正確的有限命令識(shí)別[J];計(jì)算機(jī)應(yīng)用;2005年10期
9 雷建軍;楊震;劉剛;郭軍;;噪聲魯棒語音識(shí)別研究綜述[J];計(jì)算機(jī)應(yīng)用研究;2009年04期
10 張翠麗;張申生;李磊;;基于統(tǒng)一受理的農(nóng)業(yè)呼叫中心解決方案[J];計(jì)算機(jī)應(yīng)用與軟件;2006年10期
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫 前1條
1 胡郁;語音識(shí)別中基于模型補(bǔ)償?shù)脑肼曯敯粜詥栴}研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2009年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫 前2條
1 李金娟;基于HMM模型的語音情感識(shí)別的研究[D];天津大學(xué);2007年
2 周阿轉(zhuǎn);汽車駕駛環(huán)境中的魯棒性語音識(shí)別[D];蘇州大學(xué);2012年
本文編號(hào):168820
本文鏈接:http://www.wukwdryxk.cn/shoufeilunwen/xxkjbs/168820.html
Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |
版權(quán)申明:資料由用戶586f6***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com