基于內(nèi)在激勵(lì)學(xué)習(xí)機(jī)制的電子鼻系統(tǒng)
【文章頁(yè)數(shù)】:67 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖1-1機(jī)器學(xué)習(xí)分類(lèi)結(jié)構(gòu)圖??監(jiān)督學(xué)習(xí)在分類(lèi)時(shí)存在很多問(wèn)題,例如泛化問(wèn)題、正確學(xué)習(xí)數(shù)據(jù)的選擇和處??
獎(jiǎng)勵(lì)信號(hào)才能得以持續(xù)工作。在許多場(chǎng)景下,比物嗅覺(jué)機(jī)制一樣,生物進(jìn)行嗅探行為并不是或者了獎(jiǎng)勵(lì)信號(hào)刺激,而是生物內(nèi)在自發(fā)的根據(jù)自身在少數(shù),而是廣泛存在于各種現(xiàn)實(shí)場(chǎng)景,在外部,傳統(tǒng)的強(qiáng)化學(xué)習(xí)算法將不再適用。因此,如何術(shù)領(lǐng)域的重要研究方向。??可獲取和計(jì)算機(jī)算力的快速提升,圖形圖像識(shí)別得....
圖1-2論文章節(jié)結(jié)構(gòu)圖??以下是圖丨-2中論文的具體結(jié)構(gòu):??
著更高的準(zhǔn)確性。??1.5.2?本文的主要貢獻(xiàn)??(1)提出了一種基于內(nèi)在激勵(lì)學(xué)習(xí)機(jī)制的強(qiáng)化學(xué)習(xí)框架;??(2)在框架中使用兩種方式組成內(nèi)在激勵(lì)信號(hào);??(3)實(shí)驗(yàn)研究了不同氣體(黃酒、VOC氣體)的進(jìn)氣流速與傳感器響應(yīng)的??關(guān)系,并將本文的框架與現(xiàn)有分類(lèi)算法進(jìn)行對(duì)比。??1.5....
圖2-s外部激勵(lì)行為和內(nèi)部激勵(lì)行為流程對(duì)比圖
?基于內(nèi)在激勵(lì)學(xué)習(xí)機(jī)制的電子鼻系統(tǒng)???動(dòng)?他們從事各種各樣的活動(dòng),出于好奇或樂(lè)趣,沒(méi)有得到回報(bào)。這種行為在成??人和動(dòng)物身上也能觀察到,這種行為現(xiàn)象被稱(chēng)為內(nèi)在動(dòng)機(jī)。心理學(xué)家依據(jù)動(dòng)機(jī)的??來(lái)源區(qū)分內(nèi)在動(dòng)機(jī)和外在動(dòng)機(jī)。當(dāng)獎(jiǎng)勵(lì)來(lái)自環(huán)境時(shí),它被稱(chēng)為外部動(dòng)機(jī)。??大腦會(huì)同時(shí)受外部環(huán)境和內(nèi)....
圖3-1現(xiàn)有強(qiáng)化學(xué)習(xí)框架??
現(xiàn)有強(qiáng)化學(xué)習(xí)框架是Agent在已有動(dòng)作序列中選擇一個(gè)動(dòng)作對(duì)環(huán)境產(chǎn)生影??響,環(huán)境把觀測(cè)值和外部獎(jiǎng)勵(lì)反饋給Agent,然后Agent據(jù)此使用算法對(duì)下一個(gè)??動(dòng)作序列進(jìn)行動(dòng)作選取。如圖3-1:??atu動(dòng)作???觀測(cè)值〇,?t??環(huán)境?Agent?一???^?DQN,A3C算法??外....
本文編號(hào):3978773
本文鏈接:http://www.wukwdryxk.cn/kejilunwen/yiqiyibiao/3978773.html