基于視覺(jué)的未知物體識(shí)別及機(jī)器人自主抓取研究
發(fā)布時(shí)間:2020-04-08 23:27
【摘要】:隨著機(jī)器人技術(shù)和信息技術(shù)的不斷發(fā)展,基于視覺(jué)的未知物體識(shí)別技術(shù)和機(jī)器人自主抓取技術(shù)作為機(jī)器人為人類提供自主抓取服務(wù)任務(wù)的基本能力,越來(lái)越受到相關(guān)領(lǐng)域研究者的重視。該技術(shù)可被廣泛應(yīng)用在輔助醫(yī)療、智能家居、智慧工廠等諸多領(lǐng)域,從而極大擴(kuò)展機(jī)器人的應(yīng)用范圍和應(yīng)用前景。然而,相對(duì)于實(shí)驗(yàn)室環(huán)境下的機(jī)器人未知物體識(shí)別和自主抓取研究,在真實(shí)環(huán)境下,機(jī)器人面臨著背景環(huán)境復(fù)雜,物體模型未知及人類個(gè)體行為間差異性大等眾多嚴(yán)峻挑戰(zhàn)。因此,如何使機(jī)器人在真實(shí)環(huán)境中,依據(jù)人類典型行為的識(shí)別理解,主動(dòng)抓取目標(biāo)物體,完成為人類提供自主抓取服務(wù)是一個(gè)需要克服的難題。機(jī)器人準(zhǔn)確實(shí)現(xiàn)對(duì)未知物體的識(shí)別和對(duì)人類日常生活中一些典型抓放行為的有效識(shí)別,是其能夠完成自主抓取任務(wù)的核心能力。其中未知物體識(shí)別為機(jī)器人自主抓取任務(wù)提供抓取決策能力,完成對(duì)物體可抓取性判斷,對(duì)可抓取物體種類識(shí)別和對(duì)物體抓取區(qū)域識(shí)別。人類抓放行為識(shí)別為機(jī)器人自主抓取任務(wù)提供上層決策能力,實(shí)現(xiàn)對(duì)人類典型抓取、放置和移動(dòng)物體行為的有效識(shí)別。本文采用3D視覺(jué)傳感器作為機(jī)器人主要的感知工具,主要研究人機(jī)協(xié)作背景下,機(jī)器人完成自主抓取物體任務(wù)中關(guān)鍵的視覺(jué)識(shí)別問(wèn)題,并將其劃分為三個(gè)關(guān)鍵問(wèn)題:真實(shí)環(huán)境中適合抓取物體的識(shí)別問(wèn)題,未知模型物體抓取區(qū)域的識(shí)別問(wèn)題,以及不完整數(shù)據(jù)序列下人類抓放行為的識(shí)別問(wèn)題。首先,人類抓放行為識(shí)別部分為機(jī)器人自主抓取任務(wù)提供抓取目標(biāo);然后,可抓取物體識(shí)別部分檢測(cè)識(shí)別出適合機(jī)器人進(jìn)行抓取的目標(biāo)物體;最后,未知模型物體抓取區(qū)域識(shí)別部分獲取目標(biāo)物體的抓取區(qū)域及抓取位姿,并生成機(jī)器人的抓取規(guī)劃。本文將對(duì)上述三個(gè)關(guān)鍵的視覺(jué)識(shí)別問(wèn)題展開(kāi)研究。針對(duì)訓(xùn)練數(shù)據(jù)不足情況下,傳統(tǒng)可抓取物體識(shí)別方法識(shí)別效果差、泛化能力不足的問(wèn)題,本文提出一種基于分等級(jí)特征-多任務(wù)學(xué)習(xí)機(jī)制的可抓取物體識(shí)別方法。首先,采用基于淺層核特征和自學(xué)習(xí)特征的分等級(jí)特征學(xué)習(xí)方法,從有限訓(xùn)練數(shù)據(jù)中高效的學(xué)習(xí)物體高等級(jí)圖像特征描述;然后,將可抓取物體識(shí)別問(wèn)題分解為物體可抓取性判別和可抓取物體種類識(shí)別兩個(gè)子任務(wù),并構(gòu)建一個(gè)由粗到細(xì)的多任務(wù)學(xué)習(xí)機(jī)制;最后,設(shè)計(jì)一種多任務(wù)損失函數(shù)對(duì)兩個(gè)識(shí)別任務(wù)同時(shí)進(jìn)行約束,實(shí)現(xiàn)對(duì)多任務(wù)模型的聯(lián)合優(yōu)化。其中物體可抓取性判別結(jié)果是物體抓取區(qū)域識(shí)別的前提條件,而可抓取物體種類識(shí)別結(jié)果則可識(shí)別出目標(biāo)種類物體所在區(qū)域。實(shí)驗(yàn)結(jié)果表明,該方法能夠?qū)崿F(xiàn)對(duì)可抓取物體快速、準(zhǔn)確的識(shí)別分類,并在真實(shí)環(huán)境中取得良好的識(shí)別效果。針對(duì)機(jī)器人對(duì)未知模型物體的抓取識(shí)別問(wèn)題,本文提出一種基于深度卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的物體抓取區(qū)域識(shí)別方法。該方法無(wú)需建立物體模型,可通過(guò)物體一對(duì)RGB-D圖像信息,識(shí)別出適合機(jī)器人抓取的物體區(qū)域及抓取位姿。首先,將機(jī)器人對(duì)物體的抓取問(wèn)題形式化為一個(gè)對(duì)圖像中抓取區(qū)域的識(shí)別問(wèn)題,并采用深度卷積神經(jīng)網(wǎng)絡(luò)模型來(lái)解決這一問(wèn)題;然后,為了提高模型對(duì)多通道信息的處理能力,設(shè)計(jì)一種多通道視覺(jué)信息融合方法,顯著降低模型過(guò)擬合風(fēng)險(xiǎn);其后,采用一種基于反饋機(jī)制的候選抓取區(qū)域生成算法,對(duì)物體上輸出概率最大化的抓取區(qū)域?qū)崿F(xiàn)快速搜索;最后,對(duì)抓取區(qū)域的六自由度位姿進(jìn)行有效估計(jì),并生成機(jī)器人的期望抓取位姿。實(shí)驗(yàn)結(jié)果表明,該方法在真實(shí)環(huán)境下對(duì)未知模型物體的抓取識(shí)別效果優(yōu)異,驗(yàn)證了方法的有效性和強(qiáng)泛化能力。人類行為是一種具有高度不確定性的時(shí)序信息,由于人類個(gè)體習(xí)慣不同,即使同一類別的人類行為也差異巨大。為了從不完整圖像序列信息中實(shí)現(xiàn)對(duì)人類抓放行為中典型抓取、放置和移動(dòng)行為的有效識(shí)別,本文提出一種基于改進(jìn)循環(huán)卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的人類抓放行為識(shí)別方法。首先,將人類抓放行為的識(shí)別問(wèn)題形式化為一個(gè)可端到端訓(xùn)練的編碼-解碼問(wèn)題;然后,通過(guò)卷積網(wǎng)絡(luò)模型和長(zhǎng)短期記憶模型學(xué)習(xí)表征人類抓放行為空間信息和時(shí)序信息的抽象特征;其后,通過(guò)改進(jìn)模型損失函數(shù)處理人類抓放行為圖像序列信息初始階段的高噪聲和歧義性問(wèn)題,并使模型能夠利用不完整序列信息,盡早完成對(duì)人類抓放行為的識(shí)別;最后,通過(guò)大量采樣數(shù)據(jù)樣本、合理的數(shù)據(jù)放大及設(shè)計(jì)模型訓(xùn)練步驟,實(shí)現(xiàn)對(duì)模型的訓(xùn)練優(yōu)化。實(shí)驗(yàn)結(jié)果表明,該方法對(duì)噪聲不敏感、魯棒性強(qiáng),能夠?qū)崿F(xiàn)對(duì)人類抓放行為中抓取、放置和移動(dòng)物體行為的有效識(shí)別。本文搭建機(jī)器人自主抓取實(shí)驗(yàn)平臺(tái),設(shè)計(jì)依據(jù)人類抓放行為識(shí)別結(jié)果的機(jī)器人自主抓取策略,并開(kāi)展機(jī)器人抓取未知模型物體實(shí)驗(yàn)和有人類參與的機(jī)器人自主抓取實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果表明,機(jī)器人可在真實(shí)環(huán)境下實(shí)現(xiàn)對(duì)未知模型物體的有效抓取,且機(jī)器人可依據(jù)人類抓放行為意圖的識(shí)別結(jié)果做出抓取決策,完成對(duì)目標(biāo)物體的自主抓取任務(wù)。
【圖文】:
第 1 章 緒論一個(gè)典型的傳統(tǒng)神經(jīng)網(wǎng)絡(luò)主要包括輸入層(藍(lán)色)、隱含層(綠色)和輸出層(紅色)等三個(gè)層級(jí),如圖1-1所示。圖中神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)包含 4 個(gè)輸入單元(不包含偏置項(xiàng)),3 個(gè)隱含單元(不包含偏置項(xiàng))和 1 個(gè)輸出單元,其中隱含層單元數(shù)量為模型超參數(shù),需要進(jìn)行調(diào)節(jié)以獲取最佳識(shí)別效果。圖 1-1 傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)模型Fig.1-1 The model of traditional neural networks圖中各神經(jīng)元之間的連接線代表模型權(quán)重參數(shù),包括[1] [1] [2] [2],其中[ ]向量中各項(xiàng)[ ]表示第 層上第 單元與第 層上第 個(gè)單元間的連接權(quán)重參數(shù);[ ]向量中各項(xiàng)[ ]是第 層與第 層上第 個(gè)神經(jīng)元上的偏置項(xiàng)參數(shù)。圖中[2]和[2]分別表示隱含神經(jīng)元的加權(quán)總輸入向量和激活向量;是神經(jīng)網(wǎng)絡(luò)的第 個(gè)輸出單元的輸出結(jié)果。通過(guò)將參數(shù)矩陣進(jìn)行向量化,神經(jīng)網(wǎng)絡(luò)前向傳播階段的計(jì)算過(guò)程可簡(jiǎn)化為下式。[2]∑1[1][1] [1] [1][2] [2][3] [2] [2] [2][3] [3](1-2)式中 ———表示激活函數(shù);1———表示輸入單元維度。設(shè)定神經(jīng)網(wǎng)絡(luò)模型樣本集為(1) (1) ( ) ( ),則上述神經(jīng)網(wǎng)絡(luò)模型的損失函數(shù)如式1-3所示。式中第一項(xiàng)為模型的均方差項(xiàng)
解決這一問(wèn)題的典型方法。該方法通過(guò)一種最小解釋路徑的三層神經(jīng)網(wǎng)絡(luò)來(lái)構(gòu)建一個(gè)恒等式,以實(shí)現(xiàn)對(duì)輸入數(shù)據(jù)的重構(gòu),,從而完成對(duì)輸入特征的等效變換。該方法模型結(jié)構(gòu)如圖1-2所示。圖 1-2 自編碼神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)Fig.1-2 The model of an auto-encoder圖1-2中,1 2,[ ][ ]1[ ]2[ ]和1 2分別為網(wǎng)絡(luò)輸入單元、隱含層單元和輸出單元;[ ]和[ ]分別為隱含層的輸入和輸- 8 -
【學(xué)位授予單位】:哈爾濱工業(yè)大學(xué)
【學(xué)位級(jí)別】:博士
【學(xué)位授予年份】:2018
【分類號(hào)】:TP242
本文編號(hào):2619959
【圖文】:
第 1 章 緒論一個(gè)典型的傳統(tǒng)神經(jīng)網(wǎng)絡(luò)主要包括輸入層(藍(lán)色)、隱含層(綠色)和輸出層(紅色)等三個(gè)層級(jí),如圖1-1所示。圖中神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)包含 4 個(gè)輸入單元(不包含偏置項(xiàng)),3 個(gè)隱含單元(不包含偏置項(xiàng))和 1 個(gè)輸出單元,其中隱含層單元數(shù)量為模型超參數(shù),需要進(jìn)行調(diào)節(jié)以獲取最佳識(shí)別效果。圖 1-1 傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)模型Fig.1-1 The model of traditional neural networks圖中各神經(jīng)元之間的連接線代表模型權(quán)重參數(shù),包括[1] [1] [2] [2],其中[ ]向量中各項(xiàng)[ ]表示第 層上第 單元與第 層上第 個(gè)單元間的連接權(quán)重參數(shù);[ ]向量中各項(xiàng)[ ]是第 層與第 層上第 個(gè)神經(jīng)元上的偏置項(xiàng)參數(shù)。圖中[2]和[2]分別表示隱含神經(jīng)元的加權(quán)總輸入向量和激活向量;是神經(jīng)網(wǎng)絡(luò)的第 個(gè)輸出單元的輸出結(jié)果。通過(guò)將參數(shù)矩陣進(jìn)行向量化,神經(jīng)網(wǎng)絡(luò)前向傳播階段的計(jì)算過(guò)程可簡(jiǎn)化為下式。[2]∑1[1][1] [1] [1][2] [2][3] [2] [2] [2][3] [3](1-2)式中 ———表示激活函數(shù);1———表示輸入單元維度。設(shè)定神經(jīng)網(wǎng)絡(luò)模型樣本集為(1) (1) ( ) ( ),則上述神經(jīng)網(wǎng)絡(luò)模型的損失函數(shù)如式1-3所示。式中第一項(xiàng)為模型的均方差項(xiàng)
解決這一問(wèn)題的典型方法。該方法通過(guò)一種最小解釋路徑的三層神經(jīng)網(wǎng)絡(luò)來(lái)構(gòu)建一個(gè)恒等式,以實(shí)現(xiàn)對(duì)輸入數(shù)據(jù)的重構(gòu),,從而完成對(duì)輸入特征的等效變換。該方法模型結(jié)構(gòu)如圖1-2所示。圖 1-2 自編碼神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)Fig.1-2 The model of an auto-encoder圖1-2中,1 2,[ ][ ]1[ ]2[ ]和1 2分別為網(wǎng)絡(luò)輸入單元、隱含層單元和輸出單元;[ ]和[ ]分別為隱含層的輸入和輸- 8 -
【學(xué)位授予單位】:哈爾濱工業(yè)大學(xué)
【學(xué)位級(jí)別】:博士
【學(xué)位授予年份】:2018
【分類號(hào)】:TP242
【參考文獻(xiàn)】
相關(guān)期刊論文 前1條
1 趙麗琴;韓贊勇;;人口老齡化背景下我國(guó)經(jīng)濟(jì)發(fā)展問(wèn)題研究[J];經(jīng)濟(jì)問(wèn)題;2015年10期
相關(guān)碩士學(xué)位論文 前1條
1 李重陽(yáng);基于在線避障的機(jī)器人示范編程技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2015年
本文編號(hào):2619959
本文鏈接:http://www.wukwdryxk.cn/kejilunwen/zidonghuakongzhilunwen/2619959.html
最近更新
教材專著