基于HITS的沖突Deep Web數(shù)據(jù)多真值發(fā)現(xiàn)算法
本文關(guān)鍵詞:基于HITS的沖突Deep Web數(shù)據(jù)多真值發(fā)現(xiàn)算法 出處:《計(jì)算機(jī)工程》2016年09期 論文類(lèi)型:期刊論文
更多相關(guān)文章: Web數(shù)據(jù)源 數(shù)據(jù)模型 可信度 視圖 真值發(fā)現(xiàn)
【摘要】:目前多數(shù)真值發(fā)現(xiàn)算法建立在真值唯一的基礎(chǔ)上,無(wú)法處理多真值的情況。為此,針對(duì)沖突Deep Web數(shù)據(jù)的多真值發(fā)現(xiàn)問(wèn)題,借鑒HITS算法思想,定義視圖權(quán)威度與視圖描述可信度,兩者相互影響。在此基礎(chǔ)上,定義視圖鏈接關(guān)系圖,提出多真值迭代發(fā)現(xiàn)算法MTF。當(dāng)算法收斂時(shí),權(quán)威度最大的視圖就是真值。在Book-Authors數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn),結(jié)果表明,與基準(zhǔn)算法VOTE相比,MTF算法的精確度大幅提高。
[Abstract]:At present, most of the true value algorithm is based on the true value only on the basis of that, it can not deal with multi value. Therefore, the conflict between the Deep Web data value really found the problem, using HITS algorithm, the definition of authority and credibility view view description, the mutual influence of them. On this basis, the definition of view links this map, real value iteration algorithm MTF. found that when the algorithm is convergent, the authority of the largest view is true value. Experimental results on Book-Authors data set show that compared with the standard VOTE algorithm, MTF algorithm accuracy is greatly improved.
【作者單位】: 蘭州財(cái)經(jīng)大學(xué)電子商務(wù)綜合重點(diǎn)實(shí)驗(yàn)室;貴州大學(xué)現(xiàn)代制造技術(shù)教育部重點(diǎn)實(shí)驗(yàn)室;
【基金】:國(guó)家社科基金資助項(xiàng)目“基于大數(shù)據(jù)整合的空氣質(zhì)量測(cè)度方法研究”(14GSD95) 全國(guó)統(tǒng)計(jì)科研基金資助重點(diǎn)項(xiàng)目“海量異源異物數(shù)據(jù)的采集、存儲(chǔ)和分析方案研究”(2013LZ44) 隴原創(chuàng)新人才扶持計(jì)劃基金資助項(xiàng)目(14GSD95) 甘肅省財(cái)政廳高;究蒲袠I(yè)務(wù)費(fèi)基金資助項(xiàng)目(GZ14007,GZ14023)
【分類(lèi)號(hào)】:TP393.09
【正文快照】: 中文引用格式:王繼奎,李少波.基于HITS的沖突Deep Web數(shù)據(jù)多真值發(fā)現(xiàn)算法[J].計(jì)算機(jī)工程,2016,42(9):158-162.英文引用格式:Wang Jikui,Li Shaobo.Multiple Truth Value Discovery Algorithm for Conflicting Deep Web Data Basedon HITS[J].Computer Engineering,2016,42(9):
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 蔡瓊;羅雪松;;HITS算法在Web挖掘中的應(yīng)用與改進(jìn)[J];軟件導(dǎo)刊;2008年02期
2 趙悅陽(yáng);崔雷;;應(yīng)用HITS算法對(duì)文本聚類(lèi)結(jié)果進(jìn)行類(lèi)別描述的可行性分析[J];醫(yī)學(xué)信息學(xué)雜志;2012年12期
3 趙瑩瑩;韓元杰;;基于HITS與MASEL算法的融合算法[J];桂林電子工業(yè)學(xué)院學(xué)報(bào);2006年04期
4 趙夢(mèng)龍;龍士工;劉春英;;基于HITS算法的云化模型[J];微計(jì)算機(jī)信息;2009年30期
5 謝海艇;;基于錨文本的HITS算法研究[J];內(nèi)蒙古科技與經(jīng)濟(jì);2009年12期
6 何明;周軍;紀(jì)周鵬;李樹(shù)友;;基于相似度量矩陣HITS的改進(jìn)算法[J];微電子學(xué)與計(jì)算機(jī);2010年07期
7 仲婷;金浩;馮茜蘆;潘金貴;;一種基于結(jié)構(gòu)分析的改進(jìn)HITS算法[J];廣西師范大學(xué)學(xué)報(bào)(自然科學(xué)版);2007年02期
8 苗家;馬軍;陳竹敏;;一種基于HITS算法的Blog文摘方法[J];中文信息學(xué)報(bào);2011年01期
9 陳飛;張敏;劉奕群;馬少平;;基于HITS算法的查詢結(jié)果多樣化方法[J];山東大學(xué)學(xué)報(bào)(理學(xué)版);2011年05期
10 ;[J];;年期
,本文編號(hào):1429608
本文鏈接:http://www.wukwdryxk.cn/guanlilunwen/ydhl/1429608.html