基于跨媒體特征融合的黑龍江省大米產(chǎn)地分類研究
【學位單位】:哈爾濱商業(yè)大學
【學位級別】:碩士
【學位年份】:2020
【中圖分類】:TP391.41;TS210.7
【部分圖文】:
哈爾濱商業(yè)大學碩士學位論文15設訓練集T的數(shù)據(jù)分布為:1122,,,,,,mnmTxyxyxyXY(2-1)其中nixXR,1,1iyYi1,2,,m,ix表示第i個特征向量,當1iy時則ix表示正例,當1iy時則ix表示負例。若X的分布處于二維空間中,可將上述問題轉(zhuǎn)換為一個基于決策平面與最大間隔的分類問題,處于決策平面的最大間隔兩側(cè)的點分別定義為正例和負例。如下圖2-1所示,0Txb即為決策平面的計算公式。其中,w為超平面法向量,b是常數(shù)項,x是訓練集樣本。當求解問題屬于線性可分問題時,則決策平面的數(shù)量可為無窮多個,因此需要計算決策平面與最近鄰數(shù)據(jù)點最大間隔,利用間隔最大化的方式得出使正例與負例能夠最好區(qū)分的決策平面。SVM線性分類最優(yōu)分割決策平面圖,如圖2-1所示。圖2-1SVM線性分類最優(yōu)分割超平面圖特征空間中任意點x到超平面的距離表示為:+Txbs。假設超平面,b可將訓練樣本正確分類,則1,11,1TiTixbyxby(2-2)被圈住的正例和負例距離超平面最近,并且使得公式成立,這些點被稱為支持向量(supportvector),正負例支持向量到超平面的距離之和為s,表示間隔。2s(2-3)最大化分離間隔可等價為:2,1minb2..1,1,,iistyxbim(2-4)
大米產(chǎn)地分類研究相關技術16找到滿足公式(2-4)中的約束參數(shù),b使Y最大,即可得到最優(yōu)超平面?赏ㄟ^拉格朗日乘子法來得到公式(2-4)的對偶問題,如下:1111min2mmmijijijijjjyyxx1..0,0,1,2,,miiiistyim(2-5)根據(jù)凸最優(yōu)化理論可以證明若***12=,,,m為上述對偶問題的最優(yōu)解,令****11=,,|0mmiiijiijjiiiyxbyyxxjj(2-6)則**w,b為使最大的最優(yōu)解,最終得到?jīng)Q策函數(shù):**fxsgnxb(2-7)2.2.2BP神經(jīng)網(wǎng)絡BP(BackPropagation)神經(jīng)網(wǎng)絡,是1986年由具有“神經(jīng)網(wǎng)絡之父”之稱的Hinton提出來的。相比于傳統(tǒng)的MLP算法,BP神經(jīng)網(wǎng)絡有較多的層數(shù)及單元數(shù),通過結(jié)合反向傳播算法對神經(jīng)網(wǎng)絡內(nèi)不同權重及偏置的優(yōu)化與更新,使得模型能夠擬合較多的線性及非線性分類問題,因此BP神經(jīng)網(wǎng)絡是當今人工智能領域應用較多的算法之一。BP神經(jīng)網(wǎng)絡是一類包含輸入層、隱藏層及輸出層的反向傳播神經(jīng)網(wǎng)絡,其最明顯的特征是:通過對誤差反向傳遞來實現(xiàn)網(wǎng)絡參數(shù)優(yōu)化,通過對特征的正向傳遞來進行數(shù)據(jù)的分析。一個典型的三層BP神經(jīng)網(wǎng)絡架構圖,如下圖2-2所示。圖2-2BP神經(jīng)網(wǎng)絡結(jié)構圖
哈爾濱商業(yè)大學碩士學位論文172.2.3隨機森林算法隨機森林算法是較為經(jīng)典的一種機器學習算法,其由LeoBreiman和AdeleCutler最早提出,其中所包含的集成學習思想在當今模式識別領域仍然活躍。隨機森林(RandomForest,RF)通過集成多個決策樹模型來進行計算,最終得到分類模型為hx,k,k1,,且參數(shù)集(k)是獨立同分布的隨機向量,在給定自變量x下,隨機森林中的各個決策樹模型都會給出一個預測值并利用投票機制選擇出眾多預測值中的最優(yōu)分類結(jié)果,隨機森林原理如圖2-3所示。圖2-3隨機森林原理圖利用自助采樣法(bootstrapsampling)從原始訓練集D中抽取n個樣本集12,,nDDD,且每個樣本容量均與原始訓練集D一致,未被抽到的樣本為袋外樣本(out-of-bag簡稱OOB),n個樣本集即對應n個袋外樣本OOB12,,nOOBOOBOOB;對12,,nDDD依照hx,k,k1,建立n棵不剪枝的決策樹模型形成森林,以OOB數(shù)據(jù)集作為驗證集檢驗每一棵樹模型得到袋外誤分率{error1,error2,error3,...errork},袋外誤差估計公式(2-8)可用于優(yōu)化模型參數(shù),判斷模型優(yōu)劣。11kiiOOBestimateerrorerrork(2-8)每一棵決策樹的每一個節(jié)點均從M個屬性中隨機選取m(m+M)個屬性作為候選屬性,在m個候選屬性中選擇節(jié)點純度最大的屬性作為最終節(jié)點屬性;由n棵決策樹構成了組合分類器,利用n個模型對測試集分別進行分類,得到n種分類結(jié)果;最后對n種分類結(jié)果累計投票決定其最
【相似文獻】
相關期刊論文 前10條
1 胡圣英;任紅波;張軍;孟利;;大米產(chǎn)地溯源方法研究進展[J];中國農(nóng)學通報;2020年14期
2 崔志良;安鵬;;吉林省大米品牌發(fā)展情況調(diào)查[J];合作經(jīng)濟與科技;2020年06期
3 劉金鳳;;大米適度加工檢測技術及其應用分析[J];科學技術創(chuàng)新;2020年13期
4 姜山;胡志剛;;大米拋光磨損研究綜述[J];現(xiàn)代制造技術與裝備;2020年04期
5 ;大米并非越貴越好[J];發(fā)明與創(chuàng)新(大科技);2018年08期
6 ;吉林大米:一個省級區(qū)域公用品牌的崛起之道[J];新農(nóng)業(yè);2019年10期
7 王向社;;柬埔寨前4個月大米出口量同比大增[J];世界熱帶農(nóng)業(yè)信息;2019年06期
8 王向社;;柬埔寨請求馬來西亞幫助購買大米[J];世界熱帶農(nóng)業(yè)信息;2019年07期
9 蔣文全;;新時期廣西大米品牌發(fā)展策略探討[J];納稅;2018年15期
10 張星寶;;大米紅,小米黃[J];中小學音樂教育;2008年02期
相關博士學位論文 前10條
1 萬鵬;大米品質(zhì)檢測系統(tǒng)研究[D];吉林大學;2009年
2 許慶武;地方特色大米產(chǎn)業(yè)創(chuàng)新發(fā)展研究[D];武漢理工大學;2012年
3 陳建新;過熱蒸汽焙炒黃酒釀造大米機理及其工程優(yōu)化研究[D];江南大學;2014年
4 陳溪;大米樣品中農(nóng)藥多殘留高通量分析研究[D];沈陽農(nóng)業(yè)大學;2015年
5 Nareerut Seerasarn;泰國和中國消費者對有機大米的態(tài)度和行為的交叉對比[D];中國農(nóng)業(yè)科學院;2015年
6 夏立婭;大米產(chǎn)地特征因子及溯源方法研究[D];河北大學;2013年
7 張鴻;基于相關性挖掘的跨媒體檢索研究[D];浙江大學;2007年
8 陳善峰;低溫擠壓加酶大米作啤酒輔料的試驗研究[D];河北農(nóng)業(yè)大學;2012年
9 范欣;針對移動設備的跨媒體網(wǎng)絡信息檢索及自適應信息顯示研究[D];中國科學技術大學;2007年
10 周興華;兩種轉(zhuǎn)基因大米食用安全性的毒理學研究[D];江蘇大學;2012年
相關碩士學位論文 前10條
1 李昂;基于跨媒體特征融合的黑龍江省大米產(chǎn)地分類研究[D];哈爾濱商業(yè)大學;2020年
2 宋美超;基于圖像與文本特征融合的大米分類研究[D];哈爾濱商業(yè)大學;2020年
3 呂思銘;中國大米貿(mào)易的國際競爭力研究[D];黑龍江大學;2016年
4 曾靖;大米品牌競爭力研究[D];華中農(nóng)業(yè)大學;2006年
5 孫源;吉林大米營銷策略研究[D];吉林大學;2020年
6 譚聰;消費者視角下中國大米品牌形象提升研究[D];哈爾濱商業(yè)大學;2017年
7 金杰;延邊大米品牌價值提升研究[D];延邊大學;2016年
8 張帥;我國擴大從東盟進口大米研究[D];東北財經(jīng)大學;2015年
9 郭佩佩;泰國大米國際競爭力的研究[D];浙江大學;2014年
10 陳瑋;大米氣調(diào)儲藏過程中脂質(zhì)的變化研究[D];天津科技大學;2007年
本文編號:2873627
本文鏈接:http://www.wukwdryxk.cn/shoufeilunwen/boshibiyelunwen/2873627.html