基于決策樹的三支決策概念漂移檢測(cè)
【文章頁(yè)數(shù)】:56 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖3.1三支決策概念漂移檢測(cè)框架
先介紹算法的總體框架,然后介紹算法各部分的詳細(xì)流程。3.1三支決策概念漂移檢測(cè)框架本文算法框架如圖3.1所示。整個(gè)過程分為兩個(gè)階段:離線計(jì)算階段和在線計(jì)算階段。在離線計(jì)算階段,從數(shù)據(jù)流中取出一部分樣本生成初始概念樹,這里概念樹是本文提出的一種決策樹分類器。離線階段學(xué)習(xí)得到數(shù)....
圖3.2t=4根結(jié)點(diǎn)分裂后樹圖
圖3.2t=4根結(jié)點(diǎn)分裂后樹圖圖3.3初始概念樹的分枝和葉結(jié)點(diǎn)。重復(fù)上述過程,直到。當(dāng)時(shí),生成如圖3.3所示初始概念樹。在上述算法中,假設(shè)概念樹含有個(gè)結(jié)點(diǎn),屬性個(gè)數(shù)為,每個(gè)屬性具有屬性值個(gè)數(shù)最多為,類標(biāo)個(gè)數(shù)為個(gè),則最多需要的空間來存儲(chǔ)統(tǒng)計(jì)信息。當(dāng)數(shù)據(jù)流....
圖3.3初始概念樹
圖3.2t=4根結(jié)點(diǎn)分裂后樹圖圖3.3初始概念樹的分枝和葉結(jié)點(diǎn)。重復(fù)上述過程,直到。當(dāng)時(shí),生成如圖3.3所示初始概念樹。在上述算法中,假設(shè)概念樹含有個(gè)結(jié)點(diǎn),屬性個(gè)數(shù)為,每個(gè)屬性具有屬性值個(gè)數(shù)最多為,類標(biāo)個(gè)數(shù)為個(gè),則最多需要的空間來存儲(chǔ)統(tǒng)計(jì)信息。當(dāng)數(shù)據(jù)流....
圖3.4t=40時(shí)的概念樹
樹的分類錯(cuò)誤率,設(shè)置概念樹各子樹的初始閾值。然后依照算法2對(duì)t=33到t=40的樣本進(jìn)行分類并更新決策樹。當(dāng)t=40時(shí),生成如圖3.4所示概念樹,計(jì)算分類錯(cuò)誤率并進(jìn)入第一次概念漂移判定,并對(duì)發(fā)生漂移的子樹進(jìn)行處理。表3.9數(shù)據(jù)流SU1a2a3ac....
本文編號(hào):3969198
本文鏈接:http://www.wukwdryxk.cn/guanlilunwen/lindaojc/3969198.html