面向局部特征和特征表達(dá)的圖像分類算法研究
本文選題:圖像分類 + 樸素貝葉斯。 參考:《合肥工業(yè)大學(xué)》2016年博士論文
【摘要】:圖像分類是計(jì)算機(jī)視覺研究領(lǐng)域中的熱點(diǎn)內(nèi)容,在圖像檢索、圖像標(biāo)注、監(jiān)控視頻分析等應(yīng)用中起著重要的作用。近年來,機(jī)器學(xué)習(xí)、人工智能及多媒體信息技術(shù)等學(xué)科的發(fā)展極大地推動了圖像分類技術(shù)的研究與應(yīng)用。盡管圖像分類技術(shù)已經(jīng)形成一套成熟的流程,但設(shè)計(jì)具有性能良好且計(jì)算高效的分類算法仍然具有挑戰(zhàn)性。特別是在實(shí)際應(yīng)用中,圖像分類技術(shù)仍面臨著各種各樣的困難,如光照變化、姿態(tài)變化、遮擋、訓(xùn)練樣本不足以及樣本分布差異等等;谏鲜霰尘,針對圖像分類技術(shù)存在的一些問題,本文運(yùn)用計(jì)算機(jī)視覺和機(jī)器學(xué)習(xí)中的相關(guān)方法與技術(shù),圍繞圖像分類中圖像表示模型和分類模型兩部分開展研究,主要工作成果及創(chuàng)新點(diǎn)如下:1.提出基于樸素貝葉斯K近鄰的快速圖像分類算法;樸素貝葉斯最近鄰算法(NBNN)有效避免了視覺詞袋模型中特征量化所引起的量化誤差,但該方法運(yùn)行速度慢、易受噪聲信息干擾,并且僅利用特征的最近鄰進(jìn)行分類決策。針對上述問題,本文在保留NBNN算法優(yōu)點(diǎn)的基礎(chǔ)上,提出一種基于樸素貝葉斯K近鄰的快速分類算法(NBKNN)。一方面,使用特征的K近鄰分類決策,并去除背景信息對分類性能的影響;另一方面,采用特征選擇的方式分別減少測試圖像和訓(xùn)練圖像集的特征數(shù)目,以提高算法的運(yùn)行速度、減少噪聲信息對分類性能的影響;并嘗試同時(shí)減少測試圖像和訓(xùn)練圖像集中的特征數(shù)目平衡分類正確率與分類時(shí)間之間的矛盾。2.在樸素貝葉斯最近鄰算法原理框架下,提出基于低秩稀疏分解與協(xié)作表示的圖像分類算法;當(dāng)前,大部分基于參數(shù)學(xué)習(xí)的圖像分類算法為了獲取較高的分類正確率,均需要大量的訓(xùn)練樣本進(jìn)行參數(shù)學(xué)習(xí)。然而在實(shí)際應(yīng)用中,往往存在訓(xùn)練樣本不足或獲取成本過高等問題,并且噪聲、光照、遮擋、復(fù)雜背景等各種因素使得上述問題更加突出。另一方面,盡管同類別的圖像存在一定的差異性,但它們之間同樣具有潛在的相似性和相關(guān)性,如果充分利用這種性質(zhì)將有益于最終的分類識別。為此,本文在NBNN算法原理下提出一種非參數(shù)化的圖像分類算法;诜秦(fù)稀疏編碼和最大值匯聚,將同類別的訓(xùn)練圖像表示為具有低秩性質(zhì)的特征矩陣;在此基礎(chǔ)上,利用帶有結(jié)構(gòu)不一致性約束的低秩稀疏分解構(gòu)建字典并學(xué)習(xí)低秩投影矩陣。分類過程中,使用低秩投影矩陣對測試圖像進(jìn)行投影,在NBNN算法原理的框架下,采用協(xié)作表示對其進(jìn)行分類。同時(shí),基于上述思想,假設(shè)一次性可以獲取同類別的多個測試圖像,本文也提出了一種圖像集分類算法。最后在不同的標(biāo)準(zhǔn)圖像分類集中對本文所提算法進(jìn)行了驗(yàn)證與實(shí)驗(yàn)分析。3.提出基于多稀疏表示和在線字典學(xué)習(xí)方式的域適應(yīng)圖像分類算法;傳統(tǒng)圖像分類算法的研究一般假設(shè)訓(xùn)練樣本和測試樣本源于同一個域(圖像集),具有相同的分布形式,然而這種假設(shè)在實(shí)際應(yīng)用中很難得到滿足。針對此問題,本文提出一種基于特征表示的域適應(yīng)圖像分類算法。為了減小源域和目標(biāo)域中樣本分布的差異性,假設(shè)源域和目標(biāo)域之間存在若干個中間域。算法基于稀疏表示將圖像表示為具有固定長度的BoVW特征向量,在中間域子空間建模時(shí)引入在線字典學(xué)習(xí)方法,一方面保證了樣本的重構(gòu)誤差最小,另一方面使得源域至目標(biāo)域的連接盡量光滑。最終基于源域、各中間域和目標(biāo)域子空間字典形成更具區(qū)分性能的增廣特征向量,并用于跨域分類識別。實(shí)驗(yàn)結(jié)果驗(yàn)證了本文算法的有效性,并證實(shí)了當(dāng)訓(xùn)練樣本和測試樣本源于不同域時(shí),基于域適應(yīng)的圖像分類方法取得的分類正確率更優(yōu)。
[Abstract]:Image classification is a hot topic in the field of computer vision research , plays an important role in image retrieval , image labeling , monitoring video analysis and so on . In recent years , the development of machine learning , artificial intelligence and multimedia information technology has greatly promoted the research and application of image classification technology .
The simple Bayesian nearest neighbor algorithm ( NBNN ) effectively avoids the quantization error caused by feature quantization in the visual word bag model , but the method is slow in operation , easy to be interfered by the noise information , and only utilizes the nearest neighbor of the feature to make classification decision . Based on the advantages of the NBNN algorithm , this paper proposes a fast classification algorithm ( NBKNN ) based on naive Bayes K nearest neighbor . On the one hand , the K nearest neighbor classification decision is used and the influence of background information on the classification performance is removed .
On the other hand , the feature number of the test image and the training image set is reduced by adopting the feature selection method , so as to improve the running speed of the algorithm , reduce the influence of the noise information on the classification performance , and try to reduce the contradiction between the classification accuracy and the classification time of the feature number balance classification in the test image and the training image set .
At present , most of the image classification algorithms based on parameter learning require a large number of training samples for parameter learning in order to obtain higher classification accuracy . However , in practical applications , there are some problems such as insufficient training samples or too high acquisition cost , and the problems of noise , illumination , shielding and complex background make the above - mentioned problems more prominent .
In this paper , using low rank sparse decomposition to construct a dictionary and learning a low rank projection matrix , a low rank projection matrix is used to construct a low rank projection matrix . In the classification process , a low rank projection matrix is used to classify the test image .
This paper proposes a domain adaptive image classification algorithm based on feature representation . In order to reduce the difference of sample size distribution in source domain and target domain , this paper proposes a domain adaptive image classification algorithm based on feature representation . In order to reduce sample size distribution in source domain and target domain , an online dictionary learning method is proposed based on sparse representation .
【學(xué)位授予單位】:合肥工業(yè)大學(xué)
【學(xué)位級別】:博士
【學(xué)位授予年份】:2016
【分類號】:TP391.41
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 丁曉蓮;周激流;李曉華;吳朋;;人臉識別率與圖像分辨率關(guān)系的比較分析[J];計(jì)算機(jī)工程;2009年11期
2 賈麗娟;;關(guān)于圖像分辨率的教學(xué)思考[J];印刷世界;2011年05期
3 張秀屏,,劉錫國,叢玉良;提高彩電圖像分辨率的研討[J];光學(xué)精密工程;1994年02期
4 周中華;如何使拷屏圖像更清楚[J];桌面出版與設(shè)計(jì);1999年04期
5 林阿嵐;;如何取得完美圖像[J];電子測試;2001年08期
6 宋其華;郭根生;;解析計(jì)算機(jī)圖像分辨率[J];中國電化教育;2003年11期
7 馮金菊;;淺談分辨率[J];才智;2008年22期
8 江靜;蔡鶴;;小議分辨率與輸出圖像的關(guān)系[J];科教文匯(上旬刊);2008年03期
9 李春雨;李衛(wèi)平;;篡改圖像的識別技術(shù)研究與仿真[J];計(jì)算機(jī)仿真;2011年11期
10 ;教你詳細(xì)了解各種分辨率[J];計(jì)算機(jī)與網(wǎng)絡(luò);2011年24期
相關(guān)會議論文 前10條
1 王江寧;紀(jì)力強(qiáng);;昆蟲圖像特征研究[A];第十五屆全國圖象圖形學(xué)學(xué)術(shù)會議論文集[C];2010年
2 楊德強(qiáng);蘇光大;徐天偉;;一種基于幻想臉的人臉圖像分辨率提升新技術(shù)[A];第二十七屆中國控制會議論文集[C];2008年
3 張莉;李佩臻;;用Photoshop對1:1萬DRG入庫數(shù)據(jù)的處理[A];全國測繪科技信息網(wǎng)中南分網(wǎng)第二十一次學(xué)術(shù)信息交流會論文集[C];2007年
4 任曉暉;龔勇清;;體全息存儲再現(xiàn)圖像分辨率實(shí)驗(yàn)研究[A];第十一屆全國光學(xué)測試學(xué)術(shù)討論會論文(摘要集)[C];2006年
5 廖熠;趙榮椿;;一種基于小波分層模型的自然景物圖像表面恢復(fù)算法[A];第十屆全國信號處理學(xué)術(shù)年會(CCSP-2001)論文集[C];2001年
6 劉達(dá);李樞平;;對DCI數(shù)字影院技術(shù)規(guī)范中圖像分級技術(shù)的理解[A];中國電影電視技術(shù)學(xué)會影視技術(shù)文集[C];2007年
7 湯敏;王惠南;;基于IDL語言的醫(yī)學(xué)圖像可視化初步研究[A];第十二屆全國圖象圖形學(xué)學(xué)術(shù)會議論文集[C];2005年
8 趙源萌;鄧朝;張馨;張存林;;被動式人體太赫茲安檢成像的分辨率增強(qiáng)算法研究[A];中國光學(xué)學(xué)會2011年學(xué)術(shù)大會摘要集[C];2011年
9 張尚軍;徐光;祁小江;;影響CR膠片質(zhì)量原因的探討[A];2009中華醫(yī)學(xué)會影像技術(shù)分會第十七次全國學(xué)術(shù)大會論文集[C];2009年
10 何東曉;隋守鑫;劉微;;高清透霧攝像機(jī)的研發(fā)及在交通領(lǐng)域的應(yīng)用[A];第八屆中國智能交通年會優(yōu)秀論文集——智能交通與安全[C];2013年
相關(guān)重要報(bào)紙文章 前10條
1 劉筱霞;陳永常;PHOTOSHOP中圖像分辨率的設(shè)置[N];中國包裝報(bào);2002年
2 王樹連;從購買圖像到租用衛(wèi)星[N];中國測繪報(bào);2003年
3 楊興平;如何抓取指定分辨率的圖像[N];中國電腦教育報(bào);2003年
4 李鑫;飛利浦200BW8商務(wù)人士明智新寵[N];電子資訊時(shí)報(bào);2007年
5 記者 曾遺榮邋通訊員 冷承秋 實(shí)習(xí)生 向哲林;美國一高科技公司將落戶武漢[N];湖北日報(bào);2007年
6 唐鳳碧;正確運(yùn)用數(shù)碼相機(jī)分辨率[N];中國攝影報(bào);2007年
7 ;創(chuàng)維TWH-43L(DLP)光顯背投圖像不良的檢修[N];電子報(bào);2008年
8 WLF;細(xì)說分辨率[N];電腦報(bào);2003年
9 宏杉;感受專業(yè)動力[N];中國計(jì)算機(jī)報(bào);2001年
10 宋連黨;家庭VCD像冊大制作[N];中國電腦教育報(bào);2003年
相關(guān)博士學(xué)位論文 前10條
1 吳輝群;慢性病信息管理系統(tǒng)中視網(wǎng)膜圖像的互操作性及其血管網(wǎng)絡(luò)定量分析研究[D];復(fù)旦大學(xué);2014年
2 田虎;單目圖像的深度估計(jì)[D];北京郵電大學(xué);2015年
3 唐玉芳;商品圖像分類算法研究[D];北京郵電大學(xué);2015年
4 賈勇;建筑物透視探測關(guān)鍵技術(shù)研究[D];電子科技大學(xué);2014年
5 黃仁杰;非可控條件下人臉識別中的若干問題研究[D];電子科技大學(xué);2015年
6 萬方;基于多幅圖像的三維結(jié)構(gòu)化場景重建技術(shù)研究[D];武漢大學(xué);2013年
7 馬鐘;視覺感知啟發(fā)的對象發(fā)現(xiàn)關(guān)鍵技術(shù)研究[D];西北工業(yè)大學(xué);2015年
8 張旭;面向局部特征和特征表達(dá)的圖像分類算法研究[D];合肥工業(yè)大學(xué);2016年
9 王洪;航空光電平臺圖像穩(wěn)定技術(shù)研究[D];中國科學(xué)院研究生院(長春光學(xué)精密機(jī)械與物理研究所);2012年
10 孫艷;基于內(nèi)容圖像檢索與敏感圖像過濾的若干算法研究[D];吉林大學(xué);2011年
相關(guān)碩士學(xué)位論文 前10條
1 楊棟;面向CTA圖像的冠脈血管分割算法研究和血管狹窄度分析[D];浙江大學(xué);2015年
2 龔若皓;基于嵌入式移動GPU的圖像編解碼并行優(yōu)化[D];西南交通大學(xué);2015年
3 曹福來;發(fā)動機(jī)燃油噴霧圖像篩選及處理方法的分析研究[D];長安大學(xué);2015年
4 張弛;基于卷積神經(jīng)網(wǎng)絡(luò)的鞋印圖像分類算法研究[D];大連海事大學(xué);2016年
5 張貴平;圖像視點(diǎn)調(diào)整技術(shù)研究[D];南京大學(xué);2014年
6 李杰;高速圖像數(shù)據(jù)實(shí)時(shí)存儲與顯示關(guān)鍵技術(shù)研究[D];中北大學(xué);2016年
7 胡蓓蕾;基于圖像融合的水下圖像顏色恢復(fù)[D];中國海洋大學(xué);2015年
8 周黎;基于千兆網(wǎng)的高性能嵌入式圖像處理技術(shù)研究[D];中國科學(xué)院研究生院(光電技術(shù)研究所);2016年
9 顧幫忠;基于CCD的DR影像校正[D];東南大學(xué);2015年
10 張磊;鉚釘尺寸與表面缺陷在線檢測關(guān)鍵技術(shù)研究[D];西南交通大學(xué);2016年
本文編號:2047421
本文鏈接:http://www.wukwdryxk.cn/shoufeilunwen/xxkjbs/2047421.html