結合深度圖像表示的相關濾波跟蹤方法研究
發(fā)布時間:2020-12-11 05:36
視頻在信息社會中正扮演著越來越重要的角色,從信息的豐富程度來看,視頻要遠遠超過文字或圖像。人們?nèi)粘I町a(chǎn)生的視頻數(shù)量正以驚人的速度增加。視頻網(wǎng)站自然希望能夠實現(xiàn)視頻內(nèi)容的自動化分析,從而挖掘潛在的商業(yè)價值。視覺目標跟蹤正是這一技術的關鍵點之一。過去的研究工作使用了大量的機器學習方法來嘗試解決這個問題,也取得了一定的進展。然而實際場景下拍攝的視頻比較復雜,跟蹤器飽受視頻中存在的抖動模糊、畫面分辨率低、光照強度變化等因素的影響,長時間對目標的穩(wěn)定跟蹤面臨很大的挑戰(zhàn)性。本文在近期流行的相關濾波跟蹤框架上進行了一系列改進,提出了兩種新的跟蹤方法。相關濾波器能夠高效地利用大量的樣本在線訓練,非常適合實時跟蹤。但是經(jīng)典的相關濾波跟蹤器仍然存在著定位精度不高、易跟丟等不足,針對這些問題本文提出了以下創(chuàng)新性成果。對于傳統(tǒng)的單模型方案,跟蹤器難以迅速適應目標的外觀變化,即使能勉強跟蹤上目標,輸出的預測框準確度也不高。本文提出了一種長短時雙模型融合的跟蹤方法,在原有的長時模型之外,另外學習一個短時的模型。短時模型只用與當前幀相鄰的幀訓練,目標在這些幀里高度相似,容易和背景或干擾物區(qū)分開來。長時模型做二分類...
【文章來源】:西安電子科技大學陜西省 211工程院校 教育部直屬院校
【文章頁數(shù)】:64 頁
【學位級別】:碩士
【部分圖文】:
圖1.1幾種影響跟蹤的因素??
相關和卷積類似,只是不需要翻轉,所以在濾波器的核是左右對稱的情況下,它??們是一樣的。卷積之前需要對樣本進行循環(huán)位移,通過這一步,我們就得到了一個樣??本所有平移組合的副本,如圖2.1所示。因此,即便在僅提供一個搜索域的情況下,??相關濾波器也能產(chǎn)生大量的訓練樣本,減緩了在線學習中的過擬合問題。時域的卷積??在頻域里就是點乘,為了效率,通常先將輸入變換到頻域再計算,相關操作的形式為:??■?■■EH??+30?+15?基準樣本?-15?-30??圖2.]樣本垂直方向上的循環(huán)位移??9??
目標的外觀在視頻中是持續(xù)變化的,其在視頻不同時段表現(xiàn)出的狀態(tài)往往有所??區(qū)別,因此單個模型難以識別所有情況。加上訓練時用的參考響應是二維高斯狀的,??有些地方的標簽是錯誤的(如圖2.2所示),所以即便我們跟蹤的是一個變化很小的剛??性物體,也不免要引入很多背景噪聲。隨著目標的移動,訓練中引入的噪聲會越來越??多,模型甄別目標和非目標的能力也會逐漸下降。這與我們的觀測結果是一致的,長??時模型對目標的響應會很快降低到一個低的水平,如圖2.3所示。當越來越多幀被用??于訓練時,長時模型會變得更像一個粗二分類器,更多地關注目標的語義信息,而訓??練樣本中的差異和噪聲降低了它分辨目標空間細節(jié)的能力。??我們還發(fā)現(xiàn),目標在連續(xù)幾幀中的外觀基本相同,背景也遵循這樣的規(guī)律。因此??很直接的一個想法就是再引入一個短時模型。不同于長時模型,短時模型是用最近幾??幀的樣本訓練的,對目標的響應始終保持在較高的水平。但是短時模型也
本文編號:2909991
【文章來源】:西安電子科技大學陜西省 211工程院校 教育部直屬院校
【文章頁數(shù)】:64 頁
【學位級別】:碩士
【部分圖文】:
圖1.1幾種影響跟蹤的因素??
相關和卷積類似,只是不需要翻轉,所以在濾波器的核是左右對稱的情況下,它??們是一樣的。卷積之前需要對樣本進行循環(huán)位移,通過這一步,我們就得到了一個樣??本所有平移組合的副本,如圖2.1所示。因此,即便在僅提供一個搜索域的情況下,??相關濾波器也能產(chǎn)生大量的訓練樣本,減緩了在線學習中的過擬合問題。時域的卷積??在頻域里就是點乘,為了效率,通常先將輸入變換到頻域再計算,相關操作的形式為:??■?■■EH??+30?+15?基準樣本?-15?-30??圖2.]樣本垂直方向上的循環(huán)位移??9??
目標的外觀在視頻中是持續(xù)變化的,其在視頻不同時段表現(xiàn)出的狀態(tài)往往有所??區(qū)別,因此單個模型難以識別所有情況。加上訓練時用的參考響應是二維高斯狀的,??有些地方的標簽是錯誤的(如圖2.2所示),所以即便我們跟蹤的是一個變化很小的剛??性物體,也不免要引入很多背景噪聲。隨著目標的移動,訓練中引入的噪聲會越來越??多,模型甄別目標和非目標的能力也會逐漸下降。這與我們的觀測結果是一致的,長??時模型對目標的響應會很快降低到一個低的水平,如圖2.3所示。當越來越多幀被用??于訓練時,長時模型會變得更像一個粗二分類器,更多地關注目標的語義信息,而訓??練樣本中的差異和噪聲降低了它分辨目標空間細節(jié)的能力。??我們還發(fā)現(xiàn),目標在連續(xù)幾幀中的外觀基本相同,背景也遵循這樣的規(guī)律。因此??很直接的一個想法就是再引入一個短時模型。不同于長時模型,短時模型是用最近幾??幀的樣本訓練的,對目標的響應始終保持在較高的水平。但是短時模型也
本文編號:2909991
本文鏈接:http://www.wukwdryxk.cn/kejilunwen/dianzigongchenglunwen/2909991.html
教材專著