a国产,中文字幕久久波多野结衣AV,欧美粗大猛烈老熟妇,女人av天堂

基于在線的維吾爾語語音語料庫的建立及應(yīng)用

發(fā)布時間:2018-03-16 04:21

  本文選題:維吾爾語 切入點:語料庫 出處:《新疆大學(xué)》2017年碩士論文 論文類型:學(xué)位論文


【摘要】:建立豐富的語音語料庫是研究語音技術(shù)的基礎(chǔ),從工程方面看,語音語料庫是更加完善語音技術(shù)的重要環(huán)節(jié)之一。針對現(xiàn)有的維吾爾語語音語料庫的規(guī)模不大以及發(fā)音人員年齡和地區(qū)方面不平衡等問題,面對深入研究發(fā)展的需求,維吾爾語語料庫急需擴大,尤其是對語音數(shù)據(jù)的多樣化需要改進,使其更加實用化。因此,本文研究了維吾爾語語音語料庫的建立方法及語料庫在語音識別中的應(yīng)用。主要研究內(nèi)容如下:1)對傳統(tǒng)的語音采集和語音語料的標注方法進行了改進。語音語料的采集需要大量的人力和時間。為了解決這一問題,配合維語語音數(shù)據(jù)采集工作,定制了維語錄音工具,目的是簡化錄音流程,使其更加方便地進行遠程數(shù)據(jù)采集與異地支持等工作。任何人都可以使用該平臺進行語音采集數(shù)據(jù)。為了提高語音標注工作的效率,設(shè)計了相應(yīng)的語音標注平臺。這些新方法在實際應(yīng)用中取得了很好的效果。2)根據(jù)維吾爾語的語言和語音特征,構(gòu)建了多樣化的大規(guī)模語音語料庫。每一種方言中,根據(jù)地區(qū)的不同還包含了一些土語。有些同樣的詞在不同的方言中發(fā)音不一樣。除此之外,不同年齡人的發(fā)音特征,韻律特征有一定的差異。因而,采集各地區(qū)的方言語音和各年齡段不同文化程度的自然人的語音數(shù)據(jù),對語音識別中的特征參數(shù)提取和聲學(xué)模型的優(yōu)化有著一定的研究意義。目前影響提高識別率的關(guān)鍵因素就是語音的多變性問題。建立包含盡可能多語言現(xiàn)象的語料對語音的分析和識別工作至關(guān)重要。而提高語音語料庫質(zhì)量的另一個關(guān)鍵是選取覆蓋盡可能多語言現(xiàn)象的文本。本文我們用常用詞包含程度和三音子包含程度兩種方法進行語料的篩選工作并與傳統(tǒng)的隨機篩選方法做了對比實驗,其中本文提出的三音子篩選方法的覆蓋率達到了91%。3)最后,利用語音識別技術(shù)中廣泛應(yīng)用的HMM和DNN兩種方法對采集的語音語料的一部分進行聲學(xué)特征提取和聲學(xué)模型建模并進行了連續(xù)語音識別實驗。實驗中,在語言模型方面,采用了N-gram語言模型,在Linux環(huán)境下借助kaldi語音識別工具箱進行了對比識別實驗。實驗結(jié)果表明針對大規(guī)模的語音數(shù)據(jù)來說,DNN聲學(xué)模型的語音識別結(jié)果更好。本文中基于DNN模型的識別率達到了84.49%。相比傳統(tǒng)的模型,系統(tǒng)的識別率提高了1.77%。
[Abstract]:The establishment of rich speech corpus is the basis of the study of speech technology, from the engineering point of view, The phonetic corpus is one of the most important links to perfect the speech technology. In view of the problems of the existing Uygur speech corpus, such as the small size of the existing Uygur phonetic corpus and the imbalance in the age and region of the pronunciation personnel, the need for further research and development is faced with. The Uygur corpus urgently needs to be expanded, especially the diversity of speech data needs to be improved to make it more practical. In this paper, the establishment method of Uygur speech corpus and the application of corpus in speech recognition are studied. The main research contents are as follows: (1) the traditional methods of speech acquisition and tagging of speech corpus are improved. In order to solve this problem, In conjunction with the acquisition of Uygur voice data, a Uygur recording tool was customized to simplify the recording process. Make it more convenient for remote data acquisition and remote support. Anyone can use this platform for voice data collection. In order to improve the efficiency of voice tagging, The corresponding phonetic tagging platform is designed. These new methods have achieved good results in practical application. 2) according to the language and phonological features of Uygur language, a variety of large-scale speech corpus has been constructed. Some of the same words are pronounced differently in different dialects. In addition, there are some differences in pronunciation and rhythm between people of different ages. To collect phonological data of dialects in different regions and natural persons of all ages and different educational levels, It is of great significance to study the feature parameter extraction and the optimization of acoustic model in speech recognition. At present, the key factor affecting the improvement of recognition rate is the problem of speech variability. Language with as many linguistic phenomena as possible is established. Data is very important for speech analysis and recognition. Another key to improving the quality of speech corpus is to select text that covers as many linguistic phenomena as possible. In this paper, we use common words to include degree of inclusion and triphonetic inclusion. The two methods are compared with the traditional random screening methods. The coverage of the triphonon screening method proposed in this paper has reached 91.3. finally, Two methods, HMM and DNN, which are widely used in speech recognition technology, are used to extract the acoustic features and model the acoustic model of a part of the collected speech corpus, and the experiments of continuous speech recognition are carried out. Using N-gram language model, The contrast recognition experiment is carried out with the help of kaldi speech recognition toolbox in Linux environment. The experimental results show that the speech recognition result of the acoustic model is better for large scale speech data. The recognition rate based on DNN model in this paper is better. Reached 84.49. compared with the traditional model, The recognition rate of the system increased by 1.77.
【學(xué)位授予單位】:新疆大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2017
【分類號】:TN912.34

【相似文獻】

相關(guān)期刊論文 前10條

1 ;中央人民廣播電臺新疆維吾爾語編輯部開工建設(shè)[J];青年記者;2010年15期

2 ;中央電臺新疆維吾爾語編輯部開工建設(shè)[J];中國廣播;2010年06期

3 盛朝川;;維吾爾語專線廣播[J];新聞記者;1984年03期

4 艾山·吾買爾;吐爾根·依步拉音;;基于最大熵的維吾爾語句子邊界識別模型[J];計算機工程;2010年06期

5 王昆侖;張貫虹;吐爾洪江·阿布都克力木;;維吾爾語元音的聲頻特性分析和識別[J];中文信息學(xué)報;2010年02期

6 地里木拉提.吐爾遜;艾斯卡爾.艾木都拉;;維吾爾語中清化元音的實驗語音學(xué)研究[J];中文信息學(xué)報;2010年05期

7 丁玉忠;吾守爾·斯拉木;那斯爾江·吐爾遜;;基于垃圾模型的維吾爾語關(guān)鍵詞識別[J];現(xiàn)代計算機(專業(yè)版);2011年13期

8 塔世根·加帕爾,帕爾哈提·艾孜木,伊力亞斯·吐爾遜;維吾爾語地理學(xué)術(shù)語規(guī)范表達的必要性和緊迫性[J];術(shù)語標準化與信息技術(shù);1998年04期

9 阿麗葉.阿布列孜;;中央人民廣播電臺維吾爾語頻道《生活》欄目探析[J];新聞世界;2014年05期

10 哈妮克孜·伊拉洪;祖麗皮亞·阿曼;艾斯卡爾·艾木都拉;;維吾爾語單音節(jié)詞復(fù)輔音聲學(xué)分析[J];中文信息學(xué)報;2009年04期

相關(guān)會議論文 前10條

1 吾買爾江·庫爾班;阿里甫·庫爾班;;維吾爾語框架語義知識庫語義角色描述體系研究[A];少數(shù)民族青年自然語言處理技術(shù)研究與進展——第三屆全國少數(shù)民族青年自然語言信息處理、第二屆全國多語言知識庫建設(shè)聯(lián)合學(xué)術(shù)研討會論文集[C];2010年

2 阿里甫·庫爾班;吾買爾江·庫爾班;尼加提·阿不都肉蘇力;;維吾爾語框架語義網(wǎng)的數(shù)據(jù)庫結(jié)構(gòu)的設(shè)計[A];少數(shù)民族青年自然語言處理技術(shù)研究與進展——第三屆全國少數(shù)民族青年自然語言信息處理、第二屆全國多語言知識庫建設(shè)聯(lián)合學(xué)術(shù)研討會論文集[C];2010年

3 古麗娜爾·艾力;買買提玉素甫·蘇來曼;;維吾爾語語音數(shù)據(jù)自動標注[A];少數(shù)民族青年自然語言處理技術(shù)研究與進展——第三屆全國少數(shù)民族青年自然語言信息處理、第二屆全國多語言知識庫建設(shè)聯(lián)合學(xué)術(shù)研討會論文集[C];2010年

4 阿布都熱依木·熱合曼;艾山·吾買爾;吐爾根·依布拉音;帕里旦·吐爾遜;哈里旦木·阿布都克里木;;維吾爾語句法樹庫標注體系[A];少數(shù)民族青年自然語言處理技術(shù)研究與進展——第三屆全國少數(shù)民族青年自然語言信息處理、第二屆全國多語言知識庫建設(shè)聯(lián)合學(xué)術(shù)研討會論文集[C];2010年

5 艾斯卡爾·艾木都拉;;維吾爾語鼻音的聲學(xué)特征分析[A];第九屆中國語音學(xué)學(xué)術(shù)會議論文集[C];2010年

6 梁潔;楊新璐;;維吾爾語韻律層級邊界感知及其聲學(xué)特征研究[A];第九屆中國語音學(xué)學(xué)術(shù)會議論文集[C];2010年

7 阿依克孜.卡德爾;開沙爾.卡德爾;吐爾根.依布拉音;;面向自然語言信息處理的維吾爾語名詞形態(tài)分析研究[A];第二屆全國學(xué)生計算語言學(xué)研討會論文集[C];2004年

8 吾守爾.斯拉木;馬歡;;維吾爾語文語轉(zhuǎn)換系統(tǒng)的研究[A];第十屆全國少數(shù)民族語言文字信息處理學(xué)術(shù)研討會論文集[C];2005年

9 易斌;;維吾爾語元音/y/的聲學(xué)特征分析[A];第十屆全國少數(shù)民族語言文字信息處理學(xué)術(shù)研討會論文集[C];2005年

10 艾斯卡爾·艾木都拉;賽爾達爾·雅力坤;祖麗皮亞·阿曼;地里木拉提·吐爾遜;;維吾爾語濁塞音的聲學(xué)特征分析[A];第十二屆全國人機語音通訊學(xué)術(shù)會議(NCMMSC'2013)論文集[C];2013年

相關(guān)重要報紙文章 前10條

1 記者井波、實習(xí)生郁萌;維吾爾語水平考試系統(tǒng)進入研發(fā)階段[N];新疆日報(漢);2010年

2 特約記者 藺高峰 通訊員 武瑞;女法醫(yī)“西日古麗”[N];喀什日報(漢);2010年

3 本報記者 任紅芳;阿克蘇電視臺維吾爾語譯制中心錄音棚投用[N];阿克蘇日報;2010年

4 一東;以多語種服務(wù)打造溝通新渠道[N];亞洲中心時報(漢);2011年

5 自治區(qū)地方志編委會、自治區(qū)黨委駐伽師縣工作隊 張堅義;語言架起溝通心靈的橋梁[N];新疆日報(漢);2012年

6 劉冰;從王蒙流利的維吾爾語想到的[N];中國民族報;2013年

7 記者 江亞平;搞分裂慌不擇言,熱比婭謊話連篇[N];新華每日電訊;2009年

8 陳學(xué)迅;王蒙談維吾爾民族語言文化[N];新疆日報(漢);2005年

9 記者 王新紅;中央人民廣播電臺新疆維吾爾語編輯部工程開建[N];新疆日報(漢);2010年

10 記者 達·照日格圖;我國首部蒙古文字手機研制成功[N];內(nèi)蒙古日報(漢);2006年

相關(guān)博士學(xué)位論文 前10條

1 阿布都那扎爾·阿布都拉;維吾爾語構(gòu)詞詞綴歷時比較研究[D];中央民族大學(xué);2009年

2 巴克力·阿卜杜熱西提;古代維吾爾語醫(yī)學(xué)文獻的語文學(xué)研究[D];中央民族大學(xué);2013年

3 倪宏鳴;維吾爾語和阿美語語言特征對比分析[D];中央民族大學(xué);2007年

4 魏玉清;維吾爾語和諧現(xiàn)象的音系學(xué)研究[D];華東師范大學(xué);2010年

5 尼加提·蘇皮;維吾爾語伊犁土語研究[D];中央民族大學(xué);2010年

6 斯迪克江·伊布拉音;現(xiàn)代維吾爾語中的比喻研究[D];華東師范大學(xué);2008年

7 阿克里·先木西;維吾爾語表語—系動詞謂語結(jié)構(gòu)[D];中央民族大學(xué);2012年

8 吐爾遜·卡得;維吾爾語柯坪土語研究[D];中央民族大學(xué);2011年

9 木再帕爾(Muzappar Abdurusul);論維吾爾語的名詞化短語[D];中央民族大學(xué);2007年

10 席艷玲;維吾爾語失語癥特點及其檢查法的標準化研究和維吾爾族、漢族正常人腦激活區(qū)差異性的fMRI研究[D];新疆醫(yī)科大學(xué);2013年

相關(guān)碩士學(xué)位論文 前10條

1 魏文娟;改革開放以來維吾爾語新詞研究[D];新疆大學(xué);2008年

2 阿孜古麗·阿不都熱西提;維吾爾語伊犁土語中的借詞研究[D];西北民族大學(xué);2008年

3 張紅;探析維吾爾語中茶文化[D];新疆師范大學(xué);2012年

4 熱依拉·艾紕漏拉;漢語—維吾爾語顏色詞翻譯對比研究[D];中央民族大學(xué);2013年

5 孔席梅;維吾爾語和回族話中借詞的分析比較[D];新疆師范大學(xué);2013年

6 吾斯曼·艾買爾(Osman Emer);《五體清文鑒》中的近代維吾爾語動物名稱研究[D];伊犁師范學(xué)院;2015年

7 瑪依熱·吾司曼;漢維動力情態(tài)對比研究[D];中央民族大學(xué);2015年

8 錢悅;漢語“V1著V2”結(jié)構(gòu)與維吾爾語相關(guān)表達方式對比研究[D];中央民族大學(xué);2015年

9 奇曼古麗·許庫力;現(xiàn)代維吾爾語同義詞研究[D];中央民族大學(xué);2015年

10 田媛瑋;漢語—維吾爾語五官詞匯的對比研究[D];中央民族大學(xué);2015年

,

本文編號:1618311

資料下載
論文發(fā)表

本文鏈接:http://www.wukwdryxk.cn/shoufeilunwen/xixikjs/1618311.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶f3227***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com
无码国产伦一区二区三区视频| 国产激情综合在线观看| 黄色www.| 91丨porny丨东北熟女| 无码中文人妻视频2019| 天天综合网天天综合色| 蜜臀AV在线无码国产| 91人妻人人做人碰人人爽九色| 秋霞一区| av高清在线| 中国女人内谢69XXXX视频| 亚洲精品夜夜夜妓女网| 四川丰满少妇被弄到高潮| 三级三级久久三级久久| 欧美一级做a爰片久久高潮| 久久激情视频| 久久久久久精品综合色8888| 国产乱子伦无码专区| 浮妇高潮喷白浆视频| 无码精品尤物一区二区三区| 无码一区二区三区视频| 洞口县| 九九人妻| 狠狠狠888奇米五月| 日韩色| 久热精品在线| 国产自拍区| 日韩欧美国产高清| 91青青草原免费观看| 国产无遮挡又爽又刺激的视频老师 | 久久久久久AV无码免费看大片 | 久久综合香蕉国产蜜臀AV| 国色天香精品一卡2卡3卡| 999国产精品999久久久久久| 欧美又大粗又爽又黄大片视频| 精品国精品国产自在久国产应用| 国产午夜福利久久精品| 俄罗斯一区二区无码视频| 亚洲午夜久久久国产精品| 亚洲国产成人五月综合网| 免费看国产三级片网站|