決策樹算法的研究及在空氣質(zhì)量評(píng)估中的應(yīng)用
發(fā)布時(shí)間:2024-07-08 18:47
空氣污染對(duì)人們的生活和工作都會(huì)造成不便,嚴(yán)重時(shí)還會(huì)威脅到生命財(cái)產(chǎn)安全,在民眾中引起恐慌。人們?cè)陲柺芰丝諝馕廴舅鶐淼奈:?開始重視改善空氣質(zhì)量的問題。為了能合理有效的對(duì)空氣質(zhì)量進(jìn)行改善,對(duì)大量空氣質(zhì)量數(shù)據(jù)進(jìn)行研究就變得必不可少,通過數(shù)據(jù)挖掘可從已有的數(shù)據(jù)中獲得有用信息建立分類預(yù)測(cè)模型實(shí)現(xiàn)空氣質(zhì)量預(yù)測(cè)。而決策樹算法是建立分類預(yù)測(cè)模型中比較經(jīng)典也比較常用的算法。決策樹算法由于生成規(guī)則相對(duì)容易理解以及分類結(jié)果較準(zhǔn)確等特點(diǎn)使用者眾多,然而在實(shí)際應(yīng)用中依然存在著不足。當(dāng)前在經(jīng)典算法的基礎(chǔ)上進(jìn)行改進(jìn)來提升算法的效率,也是算法研究的一個(gè)重要方向。本文研究了常用決策樹算法ID3、C4.5、CART、NBTree、REPTree的原理并采用多個(gè)數(shù)據(jù)集進(jìn)行實(shí)驗(yàn)對(duì)比分析后,選出了整體效果較好的C4.5算法作進(jìn)一步研究與改進(jìn)。為此,本文以開源平臺(tái)Weka作為實(shí)驗(yàn)環(huán)境,并重點(diǎn)研究了Weka中C4.5算法的源碼結(jié)構(gòu)。針對(duì)C4.5算法的不足,研究了改進(jìn)的C4.5BF算法和C4.5FS算法,它們分別可以在算法準(zhǔn)確率和建模時(shí)間兩個(gè)方面做出改進(jìn)。C4.5B
【文章頁數(shù)】:70 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
abstract
第1章 緒論
1.1 研究背景及意義
1.2 國內(nèi)外研究現(xiàn)狀及進(jìn)展
1.3 論文研究內(nèi)容和組織結(jié)構(gòu)
第2章 決策樹算法的研究
2.1 決策樹算法原理
2.1.1 決策樹的構(gòu)造過程
2.1.2 決策樹的性能評(píng)價(jià)
2.2 常見決策樹算法分析對(duì)比
2.2.1 ID3算法
2.2.2 C4.5算法
2.2.3 CART算法
2.2.4 其他算法
2.2.5 算法應(yīng)用實(shí)例分析
2.3 決策樹算法的性能分析
2.3.1 預(yù)處理數(shù)據(jù)
2.3.2 決策樹算法性能分析實(shí)驗(yàn)
2.3.3 決策樹算法性能分析結(jié)果
2.4 本章小結(jié)
第3章 C4.5決策樹算法的改進(jìn)性研究
3.1 基于準(zhǔn)確率的改進(jìn)算法研究
3.1.1 算法研究
3.1.2 算法實(shí)現(xiàn)
3.1.3 算法測(cè)試結(jié)果
3.2 基于速度的改進(jìn)算法研究
3.2.1 算法研究
3.2.2 算法實(shí)現(xiàn)
3.2.3 算法測(cè)試結(jié)果
3.3 本章小結(jié)
第4章 決策樹算法在空氣質(zhì)量評(píng)估中的應(yīng)用
4.1 空氣質(zhì)量數(shù)據(jù)采集及處理
4.2 決策數(shù)算法的應(yīng)用
4.2.1 基本決策樹算法的實(shí)驗(yàn)及結(jié)果分析
4.2.2 改進(jìn)C4.5算法的實(shí)驗(yàn)及結(jié)果分析
4.2.3 算法的參數(shù)優(yōu)化及模型建立
4.3 本章小結(jié)
第5章 總結(jié)與展望
5.1 總結(jié)
5.2 展望
致謝
參考文獻(xiàn)
攻讀碩士學(xué)位期間發(fā)表的學(xué)術(shù)論文
本文編號(hào):4003715
【文章頁數(shù)】:70 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
abstract
第1章 緒論
1.1 研究背景及意義
1.2 國內(nèi)外研究現(xiàn)狀及進(jìn)展
1.3 論文研究內(nèi)容和組織結(jié)構(gòu)
第2章 決策樹算法的研究
2.1 決策樹算法原理
2.1.1 決策樹的構(gòu)造過程
2.1.2 決策樹的性能評(píng)價(jià)
2.2 常見決策樹算法分析對(duì)比
2.2.1 ID3算法
2.2.2 C4.5算法
2.2.3 CART算法
2.2.4 其他算法
2.2.5 算法應(yīng)用實(shí)例分析
2.3 決策樹算法的性能分析
2.3.1 預(yù)處理數(shù)據(jù)
2.3.2 決策樹算法性能分析實(shí)驗(yàn)
2.3.3 決策樹算法性能分析結(jié)果
2.4 本章小結(jié)
第3章 C4.5決策樹算法的改進(jìn)性研究
3.1 基于準(zhǔn)確率的改進(jìn)算法研究
3.1.1 算法研究
3.1.2 算法實(shí)現(xiàn)
3.1.3 算法測(cè)試結(jié)果
3.2 基于速度的改進(jìn)算法研究
3.2.1 算法研究
3.2.2 算法實(shí)現(xiàn)
3.2.3 算法測(cè)試結(jié)果
3.3 本章小結(jié)
第4章 決策樹算法在空氣質(zhì)量評(píng)估中的應(yīng)用
4.1 空氣質(zhì)量數(shù)據(jù)采集及處理
4.2 決策數(shù)算法的應(yīng)用
4.2.1 基本決策樹算法的實(shí)驗(yàn)及結(jié)果分析
4.2.2 改進(jìn)C4.5算法的實(shí)驗(yàn)及結(jié)果分析
4.2.3 算法的參數(shù)優(yōu)化及模型建立
4.3 本章小結(jié)
第5章 總結(jié)與展望
5.1 總結(jié)
5.2 展望
致謝
參考文獻(xiàn)
攻讀碩士學(xué)位期間發(fā)表的學(xué)術(shù)論文
本文編號(hào):4003715
本文鏈接:http://www.wukwdryxk.cn/guanlilunwen/lindaojc/4003715.html
最近更新
教材專著