關(guān)聯(lián)型實體名稱數(shù)據(jù)語義聚合研究
【學(xué)位單位】:山西大學(xué)
【學(xué)位級別】:碩士
【學(xué)位年份】:2018
【中圖分類】:G254
【部分圖文】:
第二章 實體名稱數(shù)據(jù)與語義聚合年份_1920”,保留其余的項構(gòu)成 1-頻繁項集 L1;當(dāng) k=2 時,將 L1中的項兩兩連接產(chǎn)生長度等于 2 的項,計算項的支持度,同理,確定滿足最小支持度閾值的項,構(gòu)成 2-頻繁項集 L2;以此類推,L3中僅包含一個長度為 3 的項,不能產(chǎn)生 4-頻繁項集,停止掃描指令,合并所有的 Lk(k=1,2,3),即為真正的頻繁項集。
本文設(shè)計了基于關(guān)聯(lián)型實體名稱數(shù)據(jù)語義聚合整體框架,如圖2.6 所示,首先基于因果鏈求解理論及實體關(guān)系測度方法,運用單一關(guān)系實現(xiàn)同源實體名稱數(shù)據(jù)的語義聚合;再從多種實體關(guān)系考慮,利用關(guān)聯(lián)規(guī)則挖掘技術(shù)將實體關(guān)聯(lián)引申為左右為不同實體類型數(shù)據(jù)的各類規(guī)則,并對聚合規(guī)則進(jìn)行詳細(xì)的分析;最后抽取跨數(shù)據(jù)源的實體名稱數(shù)據(jù),通過模式層映射及實體相似匹配算法將指向同一對象的實體名稱整合在一起,對異源異構(gòu)數(shù)據(jù)進(jìn)行語義聚合實踐。圖 2.6 語義聚合整體框架
并通過多個人物節(jié)點揭示出潛在的人物隱性關(guān)系。例如,在圖3.1 所示的配偶關(guān)系中,以“魯迅”為主節(jié)點,“許廣平”為值節(jié)點,由圖可知共有兩條人物關(guān)系因果鏈,分別是“‘魯迅’→‘許廣平’”和“‘魯迅’→‘周海
【參考文獻(xiàn)】
相關(guān)期刊論文 前10條
1 牟冬梅;王萍;張艷俠;;基于關(guān)聯(lián)數(shù)據(jù)的數(shù)字資源語義聚合策略[J];情報資料工作;2015年05期
2 高廣尚;張智雄;;關(guān)系數(shù)據(jù)庫中實體解析研究綜述[J];現(xiàn)代圖書情報技術(shù);2015年Z1期
3 王穎;張智雄;孫輝;雷楓;;國史知識的語義揭示與組織方法研究[J];中國圖書館學(xué)報;2015年04期
4 孫建軍;徐芳;;基于關(guān)聯(lián)數(shù)據(jù)的學(xué)科網(wǎng)絡(luò)信息深度聚合框架構(gòu)建[J];圖書館;2015年07期
5 趙森棟;劉挺;;因果關(guān)系及其在社會媒體上的應(yīng)用研究綜述[J];軟件學(xué)報;2014年12期
6 邱均平;方國平;;高校圖書館語義化館藏資源深度聚合模式及其應(yīng)用研究[J];圖書館學(xué)研究;2014年21期
7 翟東升;張欣琦;張杰;;Derwent專利本體設(shè)計與構(gòu)建[J];情報科學(xué);2013年12期
8 何超;張玉峰;;基于本體的館藏數(shù)字資源語義聚合與可視化研究[J];情報理論與實踐;2013年10期
9 游毅;成全;;試論基于關(guān)聯(lián)數(shù)據(jù)的館藏資源聚合模式[J];情報理論與實踐;2013年01期
10 賀德方;曾建勛;;基于語義的館藏資源深度聚合研究[J];中國圖書館學(xué)報;2012年04期
本文編號:2851801
本文鏈接:http://www.wukwdryxk.cn/tushudanganlunwen/2851801.html