大數(shù)據(jù)分析中相關(guān)規(guī)則的挖掘和提升
發(fā)布時(shí)間:2020-08-09 08:34
【摘要】:本文在大數(shù)據(jù)決策的背景下,建立了基于相關(guān)性的決策模型,定義了相關(guān)決策系統(tǒng),設(shè)計(jì)出構(gòu)造相關(guān)決策計(jì)數(shù)表的算法,為后面的模型決策提供了數(shù)據(jù)平臺。從數(shù)據(jù)挖掘的基本算法出發(fā),將關(guān)聯(lián)規(guī)則挖掘算法進(jìn)行了改進(jìn),定義了相關(guān)規(guī)則的概念,并構(gòu)造了適用于商品推薦系統(tǒng)單個(gè)商品推薦和多個(gè)商品推薦的兩大基本算法,進(jìn)而根據(jù)生成的相關(guān)規(guī)則做出預(yù)測和決策,為特定行業(yè)的相關(guān)決策提供理論依據(jù)。本文通過實(shí)驗(yàn)對相關(guān)規(guī)則挖掘算法進(jìn)行了驗(yàn)證,并與傳統(tǒng)的關(guān)聯(lián)規(guī)則挖掘Apriori方法在算法復(fù)雜度、準(zhǔn)確率、實(shí)用性以及可推廣性等方面進(jìn)行了對比,初步證明了相關(guān)規(guī)則的有效性。為了進(jìn)一步推廣相關(guān)規(guī)則算法,從超市管理者的角度出發(fā),建立商品類與類之間的相關(guān)模型,構(gòu)造相關(guān)規(guī)則提升算法用以研究商品大類之間的相關(guān)性,最終得出結(jié)論并應(yīng)用于超市管理中,為超市的管理決策提供指導(dǎo)。本文提出的理論與方法可以通過與其他領(lǐng)域結(jié)合深入研究,獲得更廣泛的推廣應(yīng)用。
【學(xué)位授予單位】:華北電力大學(xué)(北京)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2018
【分類號】:C81
【圖文】:
這里用相關(guān)度來代替支持度和置信度的做法是參考文獻(xiàn)_中提出的新想法。逡逑在該文獻(xiàn)中,通過實(shí)驗(yàn)證明了當(dāng)K足夠大時(shí),可以過濾掉較低的支持度的規(guī)則,逡逑直接選取相關(guān)度最高的規(guī)則作為相關(guān)推薦(見圖3-1)。圖中的每個(gè)點(diǎn)分別代表著逡逑一條規(guī)則,橫坐標(biāo)代表著規(guī)則按置信度由高到低的順序進(jìn)行排列,縱坐標(biāo)代表著逡逑每條規(guī)則對應(yīng)的支持度的取值,圖3-1中可以看出,在K=0時(shí),相關(guān)度等于置逡逑信度,排在前面的規(guī)則的支持度有大有小,這些并不是想得到的相關(guān)度較高的規(guī)逡逑則。在K>10時(shí),支持度很小的規(guī)則被過濾掉了邋一部分。隨著K的再次加大,當(dāng)逡逑K=50時(shí),可以清晰的看到排在最靠前的規(guī)則的支持度都超過了邋0.5,這些規(guī)則既逡逑滿足高的置信度又滿足高的支持度?梢钥闯,隨著K的不斷增加,通過相關(guān)逡逑度的單一指標(biāo)篩選即可得到既滿足高支持度又滿足高置信度的規(guī)則。逡逑14逡逑
S?(更S*貨架邋j逡逑圖4-1超市商品管理的不同角度逡逑如圖4-1在研究超市商品管理問題時(shí)有兩種角度M,一種是從銷售人員和逡逑一般管理人員的角度來看,他們的工作是關(guān)于商品銷售、商品退化貨、增刪貨逡逑架以及促銷等方面,他們更關(guān)注的是商品小的分類之間的密切聯(lián)系。另一種角逡逑度是從超市高級管理人員的視角出發(fā),針對貨物的庫存安排、整體銷售以及統(tǒng)逡逑計(jì)貨架等方面指導(dǎo),分析商品大類之間相關(guān)性,做出商場的整體安排與決策。逡逑在本章中從超市高級管理人員的角度出發(fā),把原始的購物記錄數(shù)據(jù)根據(jù)大逡逑類進(jìn)行合并,從相關(guān)規(guī)則概念出發(fā),借助聚類算法1361的思想構(gòu)造相關(guān)規(guī)則的提逡逑26逡逑
圖4-3商品的大類分類逡逑根據(jù)商品大類之間相關(guān)性的定義,得到類與類之間的相關(guān)決策計(jì)數(shù)表。這逡逑里只需計(jì)算關(guān)于兩個(gè)類之間的相關(guān)性,得到15x15的相關(guān)矩陣見圖4-4,分別逡逑代表著每一類與其他14類之間的相關(guān)度fk的值,這里的k值參考前面相關(guān)規(guī)則逡逑的挖掘的選定為50。逡逑29逡逑
本文編號:2786875
【學(xué)位授予單位】:華北電力大學(xué)(北京)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2018
【分類號】:C81
【圖文】:
這里用相關(guān)度來代替支持度和置信度的做法是參考文獻(xiàn)_中提出的新想法。逡逑在該文獻(xiàn)中,通過實(shí)驗(yàn)證明了當(dāng)K足夠大時(shí),可以過濾掉較低的支持度的規(guī)則,逡逑直接選取相關(guān)度最高的規(guī)則作為相關(guān)推薦(見圖3-1)。圖中的每個(gè)點(diǎn)分別代表著逡逑一條規(guī)則,橫坐標(biāo)代表著規(guī)則按置信度由高到低的順序進(jìn)行排列,縱坐標(biāo)代表著逡逑每條規(guī)則對應(yīng)的支持度的取值,圖3-1中可以看出,在K=0時(shí),相關(guān)度等于置逡逑信度,排在前面的規(guī)則的支持度有大有小,這些并不是想得到的相關(guān)度較高的規(guī)逡逑則。在K>10時(shí),支持度很小的規(guī)則被過濾掉了邋一部分。隨著K的再次加大,當(dāng)逡逑K=50時(shí),可以清晰的看到排在最靠前的規(guī)則的支持度都超過了邋0.5,這些規(guī)則既逡逑滿足高的置信度又滿足高的支持度?梢钥闯,隨著K的不斷增加,通過相關(guān)逡逑度的單一指標(biāo)篩選即可得到既滿足高支持度又滿足高置信度的規(guī)則。逡逑14逡逑
S?(更S*貨架邋j逡逑圖4-1超市商品管理的不同角度逡逑如圖4-1在研究超市商品管理問題時(shí)有兩種角度M,一種是從銷售人員和逡逑一般管理人員的角度來看,他們的工作是關(guān)于商品銷售、商品退化貨、增刪貨逡逑架以及促銷等方面,他們更關(guān)注的是商品小的分類之間的密切聯(lián)系。另一種角逡逑度是從超市高級管理人員的視角出發(fā),針對貨物的庫存安排、整體銷售以及統(tǒng)逡逑計(jì)貨架等方面指導(dǎo),分析商品大類之間相關(guān)性,做出商場的整體安排與決策。逡逑在本章中從超市高級管理人員的角度出發(fā),把原始的購物記錄數(shù)據(jù)根據(jù)大逡逑類進(jìn)行合并,從相關(guān)規(guī)則概念出發(fā),借助聚類算法1361的思想構(gòu)造相關(guān)規(guī)則的提逡逑26逡逑
圖4-3商品的大類分類逡逑根據(jù)商品大類之間相關(guān)性的定義,得到類與類之間的相關(guān)決策計(jì)數(shù)表。這逡逑里只需計(jì)算關(guān)于兩個(gè)類之間的相關(guān)性,得到15x15的相關(guān)矩陣見圖4-4,分別逡逑代表著每一類與其他14類之間的相關(guān)度fk的值,這里的k值參考前面相關(guān)規(guī)則逡逑的挖掘的選定為50。逡逑29逡逑
【參考文獻(xiàn)】
相關(guān)期刊論文 前8條
1 梁吉業(yè);錢宇華;李德玉;胡清華;;大數(shù)據(jù)挖掘的粒計(jì)算理論與方法[J];中國科學(xué):信息科學(xué);2015年11期
2 楊靜;李文平;張健沛;;大數(shù)據(jù)典型相關(guān)分析的云模型方法[J];通信學(xué)報(bào);2013年10期
3 甘振韜;梅文;郭玉軍;;數(shù)據(jù)挖掘技術(shù)在網(wǎng)絡(luò)課程資源配置中的研究[J];中國醫(yī)學(xué)教育技術(shù);2012年06期
4 劉志勇;;關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘在圖書館藏書建設(shè)中的應(yīng)用研究[J];電子設(shè)計(jì)工程;2011年21期
5 孫吉貴;劉杰;趙連宇;;聚類算法研究[J];軟件學(xué)報(bào);2008年01期
6 佟強(qiáng),周園春,閻保平;關(guān)聯(lián)規(guī)則挖掘算法[J];微電子學(xué)與計(jì)算機(jī);2005年06期
7 畢建欣,張岐山;關(guān)聯(lián)規(guī)則挖掘算法綜述[J];中國工程科學(xué);2005年04期
8 羅祥林;集合子集求法初探[J];楚雄師專學(xué)報(bào);1995年03期
本文編號:2786875
本文鏈接:http://www.wukwdryxk.cn/guanlilunwen/tongjijuecelunwen/2786875.html
最近更新
教材專著