基于刑事案件要素的文本挖掘系統(tǒng)研究與實現(xiàn)
發(fā)布時間:2020-10-16 04:46
新時代依法治國的理念已經(jīng)成為中國特色社會主義的基本戰(zhàn)略,而人工智能正沖擊著法律服務(wù)的基本模式,司法智能化建設(shè)勢在必行。目前國內(nèi)外該領(lǐng)域的眾多專家已經(jīng)使用文本挖掘技術(shù)對法律案件分析進行了一定程度的局部探索,但尚未形成系統(tǒng)應(yīng)用,大量工作仍以人工為主。為此,本文以文本挖掘技術(shù)為基礎(chǔ),在某市檢察院項目的支持下,深入研究犯罪數(shù)據(jù)在司法領(lǐng)域中的應(yīng)用,設(shè)計和開發(fā)了基于刑事案件要素的文本挖掘系統(tǒng)。主要研究內(nèi)容包括:(1)通過分析法律案件的文本特點,設(shè)計出適用于刑事案件文本的分詞算法,然后提出基于案件詞性和互信息的綜合文本特征提取方法。在此基礎(chǔ)上實現(xiàn)了案件命名實體識別和要素信息的提取,經(jīng)實驗驗證提取效果較好。(2)結(jié)合啞變量和屬性約簡理論,引入以案件屬性為基礎(chǔ)的權(quán)重,設(shè)計了基于加權(quán)案件文本的K-means算法,實現(xiàn)對案件的聚類分析,并以入室盜竊案為例進行分析。(3)對刑事犯罪行為進行關(guān)聯(lián)分析。首先建立多維關(guān)聯(lián)規(guī)則模型,進行離散化和概念分層,在此基礎(chǔ)上設(shè)計多維頻繁謂詞集Apriori關(guān)聯(lián)規(guī)則算法;然后在多維關(guān)聯(lián)規(guī)則基礎(chǔ)上進行冗余規(guī)則檢查,設(shè)計了基于多層頻繁謂詞集的Apriori算法;最后將算法應(yīng)用到實際案例中驗證了模型效果,并對結(jié)果進行了分析。(4)對刑事案件文本挖掘系統(tǒng)原型進行了設(shè)計和開發(fā),實現(xiàn)了數(shù)據(jù)錄入存儲、案件數(shù)據(jù)查詢和犯罪趨勢預(yù)測等功能。并對系統(tǒng)進行全面測試,測試結(jié)果表明系統(tǒng)能較好實現(xiàn)預(yù)期目標。
【學位單位】:長安大學
【學位級別】:碩士
【學位年份】:2019
【中圖分類】:D925.2;TP391.1;TP311.52
【部分圖文】:
受案回執(zhí)(3)關(guān)鍵詞出現(xiàn)頻率低
系統(tǒng)用例圖
一般檢察官用例圖
【參考文獻】
本文編號:2842781
【學位單位】:長安大學
【學位級別】:碩士
【學位年份】:2019
【中圖分類】:D925.2;TP391.1;TP311.52
【部分圖文】:
受案回執(zhí)(3)關(guān)鍵詞出現(xiàn)頻率低
系統(tǒng)用例圖
一般檢察官用例圖
【參考文獻】
相關(guān)期刊論文 前5條
1 李曉冰;;基于Apriori算法的詐騙案件關(guān)聯(lián)規(guī)則挖掘研究[J];中國管理信息化;2015年13期
2 楊志;羅可;;一種改進的基于粒子群的聚類算法[J];計算機應(yīng)用研究;2014年09期
3 陳慧煒;;公安領(lǐng)域案件文本信息抽取研究綜述[J];文教資料;2010年18期
4 管樂;王純;;多維關(guān)聯(lián)規(guī)則挖掘在彩鈴?fù)扑]中的應(yīng)用[J];計算機系統(tǒng)應(yīng)用;2009年04期
5 王剛;莊海燕;;基于灰色關(guān)聯(lián)分析的刑事案件發(fā)案率分析[J];中國人民公安大學學報(自然科學版);2007年03期
相關(guān)博士學位論文 前1條
1 趙恒;數(shù)據(jù)挖掘中聚類若干問題研究[D];西安電子科技大學;2005年
相關(guān)碩士學位論文 前4條
1 龔言浩;基于文本挖掘的智慧城市建設(shè)的熱點與城市差異研究[D];南京大學;2018年
2 夏明;面向刑事案件的精細分類與串并案分析技術(shù)研究[D];華中科技大學;2016年
3 張榮;基于關(guān)聯(lián)規(guī)則的用戶興趣模型的研究與應(yīng)用[D];武漢理工大學;2013年
4 方洪鷹;數(shù)據(jù)挖掘中數(shù)據(jù)預(yù)處理的方法研究[D];西南大學;2009年
本文編號:2842781
本文鏈接:http://www.wukwdryxk.cn/falvlunwen/susongfa/2842781.html