百科詞條冪律分布及網(wǎng)絡(luò)結(jié)構(gòu)學習研究
發(fā)布時間:2020-05-27 12:26
【摘要】:近年來,復雜網(wǎng)絡(luò)引起各個學科的學者的廣泛關(guān)注,包括社會學,統(tǒng)計物理學,生物學,統(tǒng)計學等學科。無標度網(wǎng)絡(luò)更能形象地展示現(xiàn)實世界。無標度網(wǎng)絡(luò)的度分布服從冪律分布,冪律分布廣泛存在于自然界與生活的方方面面,且無標度網(wǎng)絡(luò)中的Hub節(jié)點對網(wǎng)絡(luò)的結(jié)構(gòu)以及功能都起著至關(guān)重要的作用。因此關(guān)于無標度現(xiàn)象的研究有助于了解實際生活中不同的現(xiàn)象的本質(zhì)規(guī)律。本文主要包括如下兩部分內(nèi)容:(1)針對百度百科詞條,收集百科特色詞條以及普通詞條的編輯歷史數(shù)據(jù),從整體編輯歷史時間間隔和用戶編輯歷史時間間隔兩方面對兩組詞條分析其分布。通過最大似然估計法計算參數(shù)以及似然比檢驗法對結(jié)果進行檢驗,結(jié)果顯示,特色詞條的整體編輯歷史時間間隔分布服從雙冪律分布,前半段的參數(shù)近似等于1.1,后半段參數(shù)均大于2,用戶編輯歷史時間間隔服從單冪律分布,參數(shù)近似等于1.1。普通詞條的整體編輯歷史時間間隔分布服從單冪律分布,參數(shù)近似等于1.1,用戶編輯歷史時間間隔服從單冪律分布,參數(shù)近似等于1.1。(2)聚焦于具有Hub的網(wǎng)絡(luò)的結(jié)構(gòu)學習問題。在鄰域選擇框架下,我們基于Hub網(wǎng)絡(luò)的特點在模型中加入_1L和_2L正則子,從而分別引入網(wǎng)絡(luò)的稀疏性先驗和Hub網(wǎng)絡(luò)的組先驗。對于所得模型,采用坐標下降法求解。模擬數(shù)據(jù)和真實數(shù)據(jù)表明所提模型的有效性和實用性。
【圖文】:
得11 1= .niix n 計算了兩個分布的參數(shù)后代入對數(shù)似然比判斷數(shù)據(jù)更擬合的分布。2.3 結(jié)果分析本節(jié)將收集到的特色詞條的兩組數(shù)據(jù)和普通詞條的兩組數(shù)據(jù)進行分析,詞條的區(qū)別。首先通過雙對數(shù)坐標圖判斷數(shù)據(jù)是否擬合冪律分布,再用最大法計算冪律分布的參數(shù),最后對冪律分布進行檢驗。2.3.1 特色詞條編輯歷史時間間隔分布收集選取的 9 個特色詞條的整體編輯歷史時間間隔數(shù)據(jù),在雙對數(shù)圖上為了更清楚的說明結(jié)果,我們將詞條分為三組,詞條 1,49,98 一組,詞99 一組,詞條 3,51,100 一組。結(jié)果分別是圖 1,,圖 2,圖 3。
得11 1= .niix n 計算了兩個分布的參數(shù)后代入對數(shù)似然比判斷數(shù)據(jù)更擬合的分布。2.3 結(jié)果分析本節(jié)將收集到的特色詞條的兩組數(shù)據(jù)和普通詞條的兩組數(shù)據(jù)進行分析,詞條的區(qū)別。首先通過雙對數(shù)坐標圖判斷數(shù)據(jù)是否擬合冪律分布,再用最大法計算冪律分布的參數(shù),最后對冪律分布進行檢驗。2.3.1 特色詞條編輯歷史時間間隔分布收集選取的 9 個特色詞條的整體編輯歷史時間間隔數(shù)據(jù),在雙對數(shù)圖上為了更清楚的說明結(jié)果,我們將詞條分為三組,詞條 1,49,98 一組,詞99 一組,詞條 3,51,100 一組。結(jié)果分別是圖 1,圖 2,圖 3。
【學位授予單位】:西北大學
【學位級別】:碩士
【學位授予年份】:2019
【分類號】:C811
本文編號:2683533
【圖文】:
得11 1= .niix n 計算了兩個分布的參數(shù)后代入對數(shù)似然比判斷數(shù)據(jù)更擬合的分布。2.3 結(jié)果分析本節(jié)將收集到的特色詞條的兩組數(shù)據(jù)和普通詞條的兩組數(shù)據(jù)進行分析,詞條的區(qū)別。首先通過雙對數(shù)坐標圖判斷數(shù)據(jù)是否擬合冪律分布,再用最大法計算冪律分布的參數(shù),最后對冪律分布進行檢驗。2.3.1 特色詞條編輯歷史時間間隔分布收集選取的 9 個特色詞條的整體編輯歷史時間間隔數(shù)據(jù),在雙對數(shù)圖上為了更清楚的說明結(jié)果,我們將詞條分為三組,詞條 1,49,98 一組,詞99 一組,詞條 3,51,100 一組。結(jié)果分別是圖 1,,圖 2,圖 3。
得11 1= .niix n 計算了兩個分布的參數(shù)后代入對數(shù)似然比判斷數(shù)據(jù)更擬合的分布。2.3 結(jié)果分析本節(jié)將收集到的特色詞條的兩組數(shù)據(jù)和普通詞條的兩組數(shù)據(jù)進行分析,詞條的區(qū)別。首先通過雙對數(shù)坐標圖判斷數(shù)據(jù)是否擬合冪律分布,再用最大法計算冪律分布的參數(shù),最后對冪律分布進行檢驗。2.3.1 特色詞條編輯歷史時間間隔分布收集選取的 9 個特色詞條的整體編輯歷史時間間隔數(shù)據(jù),在雙對數(shù)圖上為了更清楚的說明結(jié)果,我們將詞條分為三組,詞條 1,49,98 一組,詞99 一組,詞條 3,51,100 一組。結(jié)果分別是圖 1,圖 2,圖 3。
【學位授予單位】:西北大學
【學位級別】:碩士
【學位授予年份】:2019
【分類號】:C811
【參考文獻】
相關(guān)期刊論文 前4條
1 黃令賀;朱慶華;;百科詞條特征及用戶貢獻行為研究——以百度百科為例[J];中國圖書館學報;2013年01期
2 趙東杰;郝黎;李德毅;王華;何宇;;維基百科詞條編輯特性研究[J];計算機科學;2011年S1期
3 蘇東旭;楊建梅;;百度百科合作網(wǎng)絡(luò)的分形生長機制研究[J];計算機應(yīng)用研究;2010年12期
4 謝偉聰;楊建梅;;維基百科貢獻者中的人類動力學模式[J];科學學研究;2010年10期
相關(guān)碩士學位論文 前2條
1 肖強;維基百科詞條編輯次數(shù)冪律分布機制研究[D];南京大學;2014年
2 李欣榮;百度百科與谷歌開源社區(qū)比較研究[D];華南理工大學;2011年
本文編號:2683533
本文鏈接:http://www.wukwdryxk.cn/guanlilunwen/tongjijuecelunwen/2683533.html
最近更新
教材專著