基于深度學習的時序動作檢測研究
【文章頁數(shù)】:58 頁
【學位級別】:碩士
【部分圖文】:
圖2.1卷積操作示例
華中科技大學碩士學位論文轉換為另一個。常用的神經(jīng)元層由三種類型:卷積層,池化層,以通過一系列隱藏層將輸入圖像轉換為輸出向量。每個隱藏層由一對其輸入應用線性變換,即用于卷積層的卷積和用于全連接層的通常會緊隨一個激活函數(shù),例如ReLU,Sigmoid等非線性函數(shù)。和輸出是稱為特征....
圖2.2ReLU函數(shù)示意圖
設卷積步長值為S,將每個卷積核滑過輸入特征圖。當S1時跳過S像素,將產生一個空間下采樣的特征圖。最后,設對應填像素的數(shù)為P。通常我們使用它來保證輸入特征圖的空間大小,因度和高度是相同的。入特征圖的空間大小為WWD。則輸出特征圖的大小為MMW....
圖2.4FasterR-CNN網(wǎng)絡結構簡圖
圖2.4FasterR-CNN網(wǎng)絡結構簡圖[75]RPN被放置在最后的共享卷積層conv5之后,并在特征圖上滑動以確定該區(qū)否為目標。值得注意的是,RPN網(wǎng)絡與目標檢測層是共享的。具體來說,圖像入網(wǎng)絡,在經(jīng)過conv5層的卷積操作之后,特征圖被傳到RPN網(wǎng)絡....
圖3.1特征提取采樣示意圖
和內存容量的問題,整個視頻無法直接輸入網(wǎng)絡。因此,需要對視頻進行一定的處理,在獲得準確有效的特征圖的前提下,盡量減小內存的占用。首先,需要確定的是采樣的方式。設現(xiàn)有視頻V,以25fps/s的幀率將視頻拆分為圖像,拆分后的總幀數(shù)為T,則有1={f}TttV,ft代表視....
本文編號:4003332
本文鏈接:http://www.wukwdryxk.cn/kejilunwen/zidonghuakongzhilunwen/4003332.html
下一篇:沒有了