基于深度學習的視頻跟蹤技術研究
發(fā)布時間:2021-03-25 12:07
如今,作為智能監(jiān)控的關鍵技術,視頻跟蹤受到了越來越多的學者和企業(yè)的關注。視頻跟蹤是計算機視覺領域的核心課題之一,融合了圖像處理、模式識別、計算機控制以及人工智能等領域中的先進技術和核心思想。其在視頻序列初始幀時自動或手動標記目標,獲取相關信息,在后續(xù)幀中對運動目標進行實時和精確的跟蹤。然而,現(xiàn)實場景的復雜,如遮擋、形變、光照變化等給視頻跟蹤技術帶來了很大的困難和挑戰(zhàn)。經(jīng)過多年的發(fā)展,學者們提出了許多有效的視頻跟蹤算法,在一定程度上解決了復雜場景的問題。但傳統(tǒng)的視頻跟蹤算法是基于人工提取的特征,大部分只針對特定的目標和場景,泛化能力差,魯棒性不強,無法滿足智能監(jiān)控的要求。而深度學習的引入大大促進了視頻跟蹤技術的發(fā)展。本文在研究主流視頻跟蹤技術和深度學習原理及其應用的基礎上,分析了各算法在不同場景下的表現(xiàn)效果,針對基于深度學習的視頻跟蹤技術進行了深入的研究,比較了目前該領域各算法的優(yōu)缺點,并結合主流的視頻跟蹤框架,提出了一種基于深度卷積神經(jīng)網(wǎng)絡的視頻跟蹤方法。首先,基于深度學習框架caffe,利用數(shù)萬張通用數(shù)據(jù)集對網(wǎng)絡進行離線預訓練,得到深度網(wǎng)絡模型。接著,通過在線的方式訓練目標與背景的分類器。之后,采用粒子濾波的方法對目標進行在線跟蹤。本方法將深度學習模型和主流目標跟蹤框架進行了深度的結合,充分利用深度模型強大的特征表達能力,在復雜場景如遮擋、形變、光照變化的視頻序列中展現(xiàn)出了不錯的跟蹤性能,具有較好的魯棒性和準確度。
【學位授予單位】:華北電力大學(北京)
【學位級別】:碩士
【學位授予年份】:2017
【分類號】:TP391.41;TP181
本文編號:1917423
【學位授予單位】:華北電力大學(北京)
【學位級別】:碩士
【學位授予年份】:2017
【分類號】:TP391.41;TP181
文章目錄
摘要
Abstract
第1章 緒論
1.1 選題背景及意義
1.2 國內(nèi)外研究現(xiàn)狀
1.3 本文的主要工作及內(nèi)容安排
第2章 視頻跟蹤技術
2.1 算法原理及分類
2.1.1 運動模型
2.1.2 特征提取
2.1.3 表征模型
2.1.4 更新預測
2.2 主流算法及存在的問題
2.2.1 主流跟蹤算法
2.2.2 存在的問題和難點分析
2.3 本章小結
第3章 深度學習算法
3.1 深度學習簡介
3.2 深度學習的主要模型
3.2.1 深度置信網(wǎng)絡
3.2.2 堆棧自編碼器
3.2.3 深度卷積神經(jīng)網(wǎng)絡
3.3 本章小結
第4章 深度學習在視頻跟蹤技術上的應用分析
4.1 基于SAE的視頻跟蹤算法
4.2 基于CNN的視頻跟蹤算法
4.2.1 只采用CNN的算法
4.2.2 結合傳統(tǒng)跟蹤算法
4.3 本章小結
第5章 基于卷積神經(jīng)網(wǎng)絡的視頻跟蹤技術
5.1 算法總流程
5.2 粒子濾波框架
5.3 深度學習模型
5.3.1 模型選擇與結構分析
5.3.2 模型訓練
5.3.3 特征提取
5.4 支持向量機
5.5 尺度空間方法
5.5.1 目標顯著圖
5.5.2 Lindeberg尺度空間理論
5.6 算法實現(xiàn)
5.7 實驗結果與分析
5.7.1 實驗配置
5.7.2 跟蹤效果分析
5.7.3 與傳統(tǒng)跟蹤算法的比較
5.8 本章小結
第6章 總結與展望
6.1 本文總結
6.2 研究展望
參考文獻
攻讀碩士學位期間發(fā)表的論文及其他成果
致謝
【參考文獻】
相關期刊論文 前3條
1 劉少華;張茂軍;熊志輝;陳旺;;一種魯棒高效的視頻運動目標檢測與跟蹤算法[J];自動化學報;2009年08期
2 侯志強;韓崇昭;;視覺跟蹤技術綜述[J];自動化學報;2006年04期
3 田原,譚鐵牛,孫洪贊;一種具有良好魯棒性的實時跟蹤方法[J];自動化學報;2002年05期
相關碩士學位論文 前1條
1 王華華;基于統(tǒng)計學習的人臉識別方法研究[D];上海交通大學;2007年
本文編號:1917423
本文鏈接:http://www.wukwdryxk.cn/kejilunwen/zidonghuakongzhilunwen/1917423.html
最近更新
教材專著