面向大規(guī)模異構(gòu)數(shù)據(jù)的哈希表征學(xué)習(xí)研究
本文選題:哈希表征 + 異構(gòu)數(shù)據(jù); 參考:《清華大學(xué)》2016年博士論文
【摘要】:隨著異構(gòu)數(shù)據(jù)的快速增長(zhǎng),異構(gòu)數(shù)據(jù)間的檢索出現(xiàn)效率瓶頸。本文提出引入哈希這種簡(jiǎn)單的表征形式來(lái)加速異構(gòu)數(shù)據(jù)間的檢索。然而,傳統(tǒng)哈希方法無(wú)法對(duì)異構(gòu)數(shù)據(jù)的異構(gòu)性建模,因此,無(wú)法應(yīng)用于異構(gòu)數(shù)據(jù)檢索。本文針對(duì)異構(gòu)數(shù)據(jù)的三個(gè)異構(gòu)性(包括數(shù)據(jù)特征的異構(gòu)性,數(shù)據(jù)對(duì)象的異構(gòu)性以及數(shù)據(jù)網(wǎng)絡(luò)的異構(gòu)性)提出了相應(yīng)的哈希學(xué)習(xí)框架,從而實(shí)現(xiàn)了異構(gòu)數(shù)據(jù)上高效而精準(zhǔn)的相似檢索。本文的主要貢獻(xiàn)如下:1.提出面向異構(gòu)特征的哈希學(xué)習(xí):針對(duì)屬性特征高維稀疏及二值的特性和內(nèi)容特征連續(xù)低維稠密的特性,本文提出了兩個(gè)定制的概率生成模型分別對(duì)兩種不同的特征建模,從而,充分地融合了兩種特征的信息,使得哈希方法的精度得到顯著提升。2.提出面向異構(gòu)對(duì)象的哈希學(xué)習(xí):本文提出了基于關(guān)聯(lián)的異構(gòu)哈希方法(Ra HH),實(shí)現(xiàn)了跨數(shù)據(jù)域的高效相似檢索。Ra HH將不同數(shù)據(jù)域分別映射到不同的漢明空間,并基于異構(gòu)關(guān)聯(lián)關(guān)系學(xué)習(xí)漢明空間之間的映射。從而既保持了不同數(shù)據(jù)域的特性,又實(shí)現(xiàn)了跨數(shù)據(jù)域的檢索。3.提出面向異構(gòu)網(wǎng)絡(luò)的哈希學(xué)習(xí):本文主要關(guān)注關(guān)系不可傳遞的網(wǎng)絡(luò)和有向網(wǎng)絡(luò)。本文分別提出了基于相似成份的哈希學(xué)習(xí)方法及保持高階相似度的哈希學(xué)習(xí)方法,對(duì)兩種網(wǎng)絡(luò)進(jìn)行了合理建模,從而實(shí)現(xiàn)了異構(gòu)網(wǎng)絡(luò)數(shù)據(jù)上的高效相似檢索。
[Abstract]:With the rapid growth of heterogeneous data, the efficiency of heterogeneous data retrieval appears bottleneck. In this paper, a simple representation of hash is proposed to accelerate the retrieval of heterogeneous data. However, the traditional hash method can not model the heterogeneity of heterogeneous data, so it can not be applied to heterogeneous data retrieval. In this paper, a hashing learning framework is proposed for the three heterogeneity of heterogeneous data (including the heterogeneity of data characteristics, the heterogeneity of data objects and the heterogeneity of data networks). Thus, the efficient and accurate similarity retrieval on heterogeneous data is realized. The main contributions of this paper are as follows: 1. Aiming at the high dimensional sparse and binary characteristics of attribute features and the continuous low dimensional dense characteristics of content features, two customized probability generation models are proposed to model the two different features respectively. The accuracy of the hashing method is greatly improved by fully integrating the information of the two features. A heterogeneous object oriented hash learning is proposed. In this paper, an association-based heterogeneous hash method (Ra HH) is proposed, which implements the efficient similarity retrieval across data domains. Ra HH maps different data domains to different hamming spaces. And learning the mapping between the Han Ming space based on the heterogeneous association relationship. Thus, it not only maintains the characteristics of different data domains, but also realizes the retrieval of. 3. 3 across data domains. Hashing learning for heterogeneous networks is proposed: this paper focuses on networks with intransisible relationships and directed networks. In this paper, hashing learning method based on similarity component and hashing learning method based on maintaining high order similarity are proposed, and two kinds of networks are modeled reasonably, so as to realize efficient similarity retrieval on heterogeneous network data.
【學(xué)位授予單位】:清華大學(xué)
【學(xué)位級(jí)別】:博士
【學(xué)位授予年份】:2016
【分類號(hào)】:TP391.3
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 趙琳;黃玉文;;異構(gòu)數(shù)據(jù)交換的理論研究[J];科技信息;2010年21期
2 張琦,吳敏,黎干;基于XML Web Service的分布式異構(gòu)數(shù)據(jù)透明轉(zhuǎn)換機(jī)制[J];電腦與信息技術(shù);2004年04期
3 劉揚(yáng),趙文吉,宮輝力;關(guān)于異構(gòu)數(shù)據(jù)連接的研究[J];首都師范大學(xué)學(xué)報(bào)(自然科學(xué)版);2005年01期
4 鄒曉玉;;一種異構(gòu)數(shù)據(jù)的解決方案[J];臺(tái)聲.新視角;2006年01期
5 尹國(guó)標(biāo);樓勇亮;;異構(gòu)數(shù)據(jù)如何“手拉手”[J];信息系統(tǒng)工程;2008年01期
6 刁興春;嚴(yán)浩;丁鯤;;異構(gòu)數(shù)據(jù)轉(zhuǎn)換關(guān)鍵技術(shù)的實(shí)現(xiàn)[J];計(jì)算機(jī)工程;2008年17期
7 梁艷;胡先智;;異構(gòu)數(shù)據(jù)轉(zhuǎn)換系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[J];信息與電腦(理論版);2011年08期
8 詹國(guó)華;何炎雯;李志華;;智能健康管理多源異構(gòu)數(shù)據(jù)融合體系與方法[J];計(jì)算機(jī)應(yīng)用與軟件;2012年09期
9 唐鈺;陳浩;葉柏龍;;基于逆向清理的實(shí)時(shí)異構(gòu)數(shù)據(jù)整合模型研究[J];計(jì)算機(jī)工程;2012年23期
10 梁合功;;異構(gòu)數(shù)據(jù)遷移系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[J];科技致富向?qū)?2013年23期
相關(guān)會(huì)議論文 前6條
1 姚燕;李湘;郭萍;鄭波;;基于中間件的異構(gòu)數(shù)據(jù)檢索服務(wù)[A];2011年中國(guó)氣象學(xué)會(huì)氣象通信與信息技術(shù)委員會(huì)暨國(guó)家氣象信息中心科技年會(huì)論文摘要[C];2011年
2 伍尚杰;陳立定;曾明;;基于XML異構(gòu)數(shù)據(jù)的組態(tài)軟件[A];中南六。▍^(qū))自動(dòng)化學(xué)會(huì)第24屆學(xué)術(shù)年會(huì)會(huì)議論文集[C];2006年
3 李剛;高春陽(yáng);崔明;;高校異構(gòu)數(shù)據(jù)整合平臺(tái)建設(shè)研究[A];第十屆沈陽(yáng)科學(xué)學(xué)術(shù)年會(huì)論文集(信息科學(xué)與工程技術(shù)分冊(cè))[C];2013年
4 江濤;劉東波;劉巍;;基于XML的異構(gòu)數(shù)據(jù)集成中間件研究[A];促進(jìn)企業(yè)信息化進(jìn)程——第十屆中國(guó)Java技術(shù)及應(yīng)用大會(huì)文集[C];2007年
5 周翔;翁劍成;榮建;;基于MDA的異構(gòu)交通數(shù)據(jù)管理平臺(tái)的研究與開發(fā)[A];2007第三屆中國(guó)智能交通年會(huì)論文集[C];2007年
6 陳亞洲;齊從謙;甘屹;;基于Web的CAM異構(gòu)數(shù)據(jù)轉(zhuǎn)換和傳輸?shù)难芯縖A];制造業(yè)與未來(lái)中國(guó)——2002年中國(guó)機(jī)械工程學(xué)會(huì)年會(huì)論文集[C];2002年
相關(guān)重要報(bào)紙文章 前2條
1 汪蔚;跨平臺(tái)異構(gòu)數(shù)據(jù)對(duì)接是選型根本[N];中國(guó)計(jì)算機(jī)報(bào);2004年
2 西岸;Network Appliance發(fā)布新異構(gòu)數(shù)據(jù)保護(hù)方案[N];通信產(chǎn)業(yè)報(bào);2003年
相關(guān)博士學(xué)位論文 前4條
1 吳紅星;面向多業(yè)態(tài)集團(tuán)企業(yè)多源異構(gòu)數(shù)據(jù)的協(xié)同系統(tǒng)集成方法研究[D];合肥工業(yè)大學(xué);2015年
2 歐明棟;面向大規(guī)模異構(gòu)數(shù)據(jù)的哈希表征學(xué)習(xí)研究[D];清華大學(xué);2016年
3 于寶琴;成套電器企業(yè)異構(gòu)數(shù)據(jù)整合及其物流系統(tǒng)的研究[D];天津大學(xué);2006年
4 繆嘉嘉;異構(gòu)數(shù)據(jù)映射技術(shù)研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2008年
相關(guān)碩士學(xué)位論文 前10條
1 高姣姣;MUSER異構(gòu)數(shù)據(jù)采集及融合技術(shù)研究[D];昆明理工大學(xué);2015年
2 高湛;基于混支持度和粗糙集的異構(gòu)數(shù)據(jù)融合研究[D];燕山大學(xué);2015年
3 鄭文明;基于XML的異構(gòu)數(shù)據(jù)交換在汽車零部件產(chǎn)業(yè)價(jià)值鏈協(xié)同云服務(wù)平臺(tái)的研究與應(yīng)用[D];西南交通大學(xué);2015年
4 陳毅飛;基于多源異構(gòu)數(shù)據(jù)的楊凌水肥信息管理系統(tǒng)研究[D];西北農(nóng)林科技大學(xué);2015年
5 葉茂偉;大規(guī)模異構(gòu)數(shù)據(jù)即時(shí)整合系統(tǒng)的研究與實(shí)現(xiàn)[D];浙江大學(xué);2016年
6 荊志;海量異構(gòu)數(shù)據(jù)定制平臺(tái)的設(shè)計(jì)與實(shí)現(xiàn)[D];河北師范大學(xué);2013年
7 朱峰;基于JSON的互聯(lián)網(wǎng)異構(gòu)數(shù)據(jù)整合的應(yīng)用研究[D];南京郵電大學(xué);2016年
8 李瀚晨;基于“用戶—景點(diǎn)”關(guān)系建模的景點(diǎn)推薦技術(shù)的研究[D];北京工業(yè)大學(xué);2016年
9 徐凱;智慧高速海量異構(gòu)數(shù)據(jù)處理關(guān)鍵技術(shù)研究[D];重慶交通大學(xué);2016年
10 徐若濤;艦船維護(hù)中異構(gòu)數(shù)據(jù)融合系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];華中科技大學(xué);2016年
,本文編號(hào):2116272
本文鏈接:http://www.wukwdryxk.cn/shoufeilunwen/xxkjbs/2116272.html