基于社交網(wǎng)絡(luò)節(jié)點特性的鏈路預(yù)測算法研究
本文選題:社交網(wǎng)絡(luò) 切入點:鏈路預(yù)測 出處:《新疆大學(xué)》2017年碩士論文 論文類型:學(xué)位論文
【摘要】:如今計算機技術(shù)飛速發(fā)展,網(wǎng)絡(luò)技術(shù)改變了人們的生活。各種社交網(wǎng)站的流行及智能終端的普及,使人們在虛擬的網(wǎng)絡(luò)中留下了海量的、真實的數(shù)據(jù),這為網(wǎng)絡(luò)分析研究提供了數(shù)據(jù)基礎(chǔ)。隨著社交網(wǎng)絡(luò)的不斷壯大,人們在享受豐富的數(shù)字生活帶來便捷的同時也感受到了信息膨脹帶來的煩惱,即人們無法在海量數(shù)據(jù)中快速有效地提取的最相關(guān)的信息價值。對網(wǎng)絡(luò)中可能存在或者已存在但未被發(fā)現(xiàn)的鏈接進行預(yù)測,有利于分析網(wǎng)絡(luò)數(shù)據(jù)的缺失、分析復(fù)雜網(wǎng)絡(luò)演化機制等問題,該研究在社交網(wǎng)絡(luò)分析中具有重要意義。根據(jù)網(wǎng)絡(luò)中已有的鏈接信息預(yù)測將來可能產(chǎn)生的鏈接,是網(wǎng)絡(luò)分析的基本問題,在商業(yè)社交應(yīng)用界也被廣泛需求。目前,主要有基于局部信息相似性、基于路徑和基于隨機游走三類鏈路預(yù)測算法;诰植啃畔⑾嗨菩缘乃惴ㄟ\算簡單,算法復(fù)雜度低,預(yù)測精度也相對較低,是目前運用最廣泛的鏈路預(yù)測方法;诼窂胶突陔S機游走的方法較復(fù)雜,算法的時間復(fù)雜度高,對實際社交網(wǎng)絡(luò)的應(yīng)用性低,F(xiàn)有的基于局部相似性的鏈路預(yù)測方法,多數(shù)僅使用節(jié)點度進行預(yù)測,沒有體現(xiàn)出重要節(jié)點度的作用,因此使算法的預(yù)測效果降低。提升鏈路預(yù)測精度是復(fù)雜網(wǎng)絡(luò)研究的基礎(chǔ)問題之一。本文對社交網(wǎng)絡(luò)中鏈路預(yù)測問題進行了研究,主要工作和貢獻(xiàn)如下:1、一些具有重要作用的節(jié)點可能具有更大的影響力或者更強的信息傳播能力,現(xiàn)有的基于節(jié)點相似的鏈路預(yù)測指標(biāo)沒有充分利用網(wǎng)絡(luò)節(jié)點的重要性,針對該問題提出基于節(jié)點重要性的鏈路預(yù)測算法,新的算法在共同鄰居、Adamic-Adar、Resource Allocation相似性算法的基礎(chǔ)上,充分利用了節(jié)點度中心性、接近中心性及介數(shù)中心性的信息,提出考慮節(jié)點重要性的CN、AA、RA鏈路預(yù)測相似性算法。改進的算法在4個真實數(shù)據(jù)集上進行仿真實驗,以AUC值作為鏈路預(yù)測精度評價指標(biāo),實驗結(jié)果表明,改進的算法在4個數(shù)據(jù)集上的鏈路預(yù)測精度均高于對比算法,能夠?qū)?fù)雜網(wǎng)絡(luò)結(jié)構(gòu)產(chǎn)生更精確的分析預(yù)測。2、通過挖掘節(jié)點的鄰居節(jié)點間的深層次的相互作用,對共同鄰居節(jié)點所攜帶的網(wǎng)絡(luò)二級結(jié)構(gòu)拓?fù)湫畔⑦M行過濾,提出節(jié)點聚類能力的計算方法。3、現(xiàn)有的基于局部信息相似性的鏈路預(yù)測指標(biāo)沒有充分考慮節(jié)點的聚類信息,在傳統(tǒng)網(wǎng)絡(luò)節(jié)點信息分類的基礎(chǔ)上,通過網(wǎng)絡(luò)中更穩(wěn)定的三角形關(guān)系對二級拓?fù)浣Y(jié)構(gòu)信息進行過濾,提出基于節(jié)點聚類能力的鏈路預(yù)測方法。新的算法充分使用了共同鄰居節(jié)點的聚類信息,使聚類能力強的節(jié)點在鏈路預(yù)測過程中發(fā)揮更大的作用。改進的算法在四類真實數(shù)據(jù)集上以MATLAB為仿真工具進行實驗,在各數(shù)據(jù)集上以AUC和Precision為指標(biāo),改進的算法能夠產(chǎn)生更準(zhǔn)確的預(yù)測結(jié)果。
[Abstract]:Nowadays, with the rapid development of computer technology, network technology has changed people's lives. The popularity of various social networking sites and the popularity of intelligent terminals make people leave massive, real data in the virtual network. This provides a data base for network analysis research. As social networks continue to grow, people enjoy the convenience of a rich digital life and feel the annoyance of information inflation. That is, the most relevant information value that people can not extract quickly and effectively from the massive data. It is helpful to analyze the missing of network data by predicting the links that may exist or exist but are not found in the network. Analyzing the evolution mechanism of complex networks is of great significance in the analysis of social networks. It is the basic problem of network analysis to predict the possible links in the future according to the existing link information in the network. At present, there are three kinds of link prediction algorithms based on local information similarity, path and random walk. The algorithm based on local information similarity is simple, and the algorithm complexity is low. The prediction accuracy is also relatively low, which is the most widely used link prediction method. The method based on path and random walk is more complex, and the time complexity of the algorithm is high. Most of the existing link prediction methods based on local similarity only use node degree to predict, which does not reflect the function of important node degree. Therefore, the prediction effect of the algorithm is reduced. Improving the link prediction accuracy is one of the basic problems in the research of complex networks. In this paper, the link prediction problem in social networks is studied. The main work and contributions are as follows: 1. Some important nodes may have greater influence or greater ability to disseminate information. Existing link prediction indicators based on similar nodes do not take full advantage of the importance of network nodes. In order to solve this problem, a link prediction algorithm based on node importance is proposed. Based on the common neighbor Adamic-Adarresource Allocation similarity algorithm, the new algorithm makes full use of the information of node centrality, proximity centrality and intermediate centrality. A link prediction similarity algorithm considering node importance is proposed. The improved algorithm is simulated on four real data sets, and the AUC value is used as the evaluation index of link prediction accuracy. The experimental results show that, The improved algorithm has higher link prediction accuracy on the four data sets than the contrast algorithm, which can produce more accurate analysis and prediction of complex network structure. The network secondary structure topology information carried by the common neighbor node is filtered, and the calculation method of node clustering ability is proposed. The existing link prediction index based on the similarity of local information does not fully consider the clustering information of the node. On the basis of the traditional network node information classification, the secondary topology information is filtered through the more stable triangle relation in the network. A link prediction method based on node clustering ability is proposed. The new algorithm makes full use of the clustering information of common neighbor nodes. The improved algorithm is tested on four kinds of real data sets using MATLAB as simulation tool and AUC and Precision as indexes on each data set. The improved algorithm can produce more accurate prediction results.
【學(xué)位授予單位】:新疆大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2017
【分類號】:TP393.09
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 郭桂蓉,申強;浮窗零階預(yù)測算法所獲壓縮比的統(tǒng)計計算[J];電子學(xué)報;1986年01期
2 王萬良;正交逼近預(yù)測算法及其在電腦充絨機中的應(yīng)用[J];信息與控制;1994年04期
3 李文澤;盛光磊;;一種基于粒子群的實際業(yè)務(wù)流預(yù)測算法[J];微電子學(xué)與計算機;2014年01期
4 楊斷利;張立梅;籍穎;呂晶;;河北省風(fēng)能特征及其對風(fēng)速預(yù)測算法的改進[J];科技傳播;2013年06期
5 朱斌;樊祥;馬東輝;程正東;;窗口大小和權(quán)值模板對固定權(quán)值背景預(yù)測算法的影響[J];紅外與激光工程;2006年S4期
6 王祖儷;程小平;;入侵響應(yīng)中基于事件相關(guān)性的攻擊預(yù)測算法[J];計算機科學(xué);2005年04期
7 徐慶飛;張新;李衛(wèi)民;;二維空間中目標(biāo)軌跡預(yù)測算法研究與分析[J];航空電子技術(shù);2012年01期
8 楊雙懋;郭偉;唐偉;;基于FARIMA-GARCH模型的網(wǎng)絡(luò)業(yè)務(wù)預(yù)測算法[J];通信學(xué)報;2013年03期
9 李楚斐;譚長庚;韓宇;;車輛網(wǎng)絡(luò)單跳鏈路斷開時間預(yù)測算法[J];計算機工程;2012年02期
10 周璇;楊建成;;基于支持向量回歸機的空調(diào)逐時負(fù)荷滾動預(yù)測算法[J];中南大學(xué)學(xué)報(自然科學(xué)版);2014年03期
相關(guān)會議論文 前10條
1 朱斌;樊祥;馬東輝;程正東;;窗口大小和權(quán)值模板對固定權(quán)值背景預(yù)測算法的影響[A];2006年全國光電技術(shù)學(xué)術(shù)交流會會議文集(D 光電信息處理技術(shù)專題)[C];2006年
2 王峰;姬冰輝;李斗;;一種基于混沌理論的自相似業(yè)務(wù)流預(yù)測算法研究[A];2006北京地區(qū)高校研究生學(xué)術(shù)交流會——通信與信息技術(shù)會議論文集(上)[C];2006年
3 錢正祥;徐華;張申浩;;數(shù)字信號序列的向量預(yù)測算法[A];第三屆全國信息獲取與處理學(xué)術(shù)會議論文集[C];2005年
4 郭景峰;代軍麗;馬鑫;王娟;;針對通信社會網(wǎng)絡(luò)的時間序列鏈接預(yù)測算法[A];第26屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(A輯)[C];2009年
5 張利萍;李宏光;;改進的灰色預(yù)測算法在工業(yè)應(yīng)用中的評價[A];第二屆全國信息獲取與處理學(xué)術(shù)會議論文集[C];2004年
6 崔冬;;一種改進的LRP信道預(yù)測算法[A];2006通信理論與技術(shù)新進展——第十一屆全國青年通信學(xué)術(shù)會議論文集[C];2006年
7 王佳;殷海兵;周冰倩;;一種適合硬件實現(xiàn)的低復(fù)雜度MAD預(yù)測算法[A];浙江省電子學(xué)會2011學(xué)術(shù)年會論文集[C];2011年
8 鄭銘浩;劉志紅;巫瑞波;徐峻;;P450各亞型代謝調(diào)控劑預(yù)測算法[A];中國化學(xué)會第28屆學(xué)術(shù)年會第14分會場摘要集[C];2012年
9 張曉丹;王萍;;一種基于特征的H.264的子塊快速幀內(nèi)預(yù)測算法[A];第七屆和諧人機環(huán)境聯(lián)合學(xué)術(shù)會議(HHME2011)論文集【oral】[C];2011年
10 劉志紅;鄭銘浩;嚴(yán)鑫;巫瑞波;徐峻;;基于結(jié)構(gòu)的化合物穩(wěn)定性預(yù)測算法[A];中國化學(xué)會第28屆學(xué)術(shù)年會第14分會場摘要集[C];2012年
相關(guān)博士學(xué)位論文 前2條
1 馬玉韜;基于濾波理論和特征統(tǒng)計的蛋白質(zhì)編碼區(qū)預(yù)測算法研究[D];天津大學(xué);2013年
2 玄萍;MicroRNA識別及其與疾病關(guān)聯(lián)的預(yù)測算法研究[D];哈爾濱工業(yè)大學(xué);2012年
相關(guān)碩士學(xué)位論文 前10條
1 吳智勇;學(xué)術(shù)論文排序預(yù)測算法研究[D];內(nèi)蒙古大學(xué);2015年
2 張勇攀;針對殘缺IP網(wǎng)絡(luò)的鏈路預(yù)測技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2015年
3 應(yīng)超;博物館移動導(dǎo)覽中的遠(yuǎn)程展示技術(shù)研究及系統(tǒng)實現(xiàn)[D];浙江大學(xué);2015年
4 常艷華;基于數(shù)據(jù)驅(qū)動模擬電路故障預(yù)測算法實現(xiàn)與軟件開發(fā)[D];電子科技大學(xué);2015年
5 閆青;基于預(yù)測算法的快速多尺度金字塔時空特征點計算算法研究[D];青島科技大學(xué);2016年
6 錢呂見;復(fù)雜網(wǎng)絡(luò)中基于角色傳遞性和對稱性的鏈接預(yù)測算法研究[D];蘭州大學(xué);2016年
7 李小科;無模型自適應(yīng)預(yù)測算法及其在非線性過程控制中的應(yīng)用[D];蘭州大學(xué);2016年
8 周攀;基于姿態(tài)傳感器的人體步態(tài)預(yù)測算法設(shè)計與實現(xiàn)[D];西南交通大學(xué);2016年
9 周真爭;基于社團綜合屬性的鏈路預(yù)測算法研究[D];南京信息工程大學(xué);2016年
10 任程;DSP+FPGA平臺功耗管理的研究與實現(xiàn)[D];哈爾濱工業(yè)大學(xué);2016年
,本文編號:1630715
本文鏈接:http://www.wukwdryxk.cn/shoufeilunwen/xixikjs/1630715.html