隨機(jī)森林算法改進(jìn)及其在醫(yī)療診斷系統(tǒng)中的應(yīng)用
發(fā)布時(shí)間:2024-06-04 03:10
隨著醫(yī)療信息化技術(shù)的發(fā)展,各大醫(yī)院逐步建立起完備的電子信息系統(tǒng),為醫(yī)療診斷與大數(shù)據(jù)挖掘技術(shù)相融合提供了充分的數(shù)據(jù)支持。其中隨機(jī)森林算法因其分類準(zhǔn)確率高的優(yōu)點(diǎn)成為運(yùn)用最廣泛的挖掘算法之一。然而,醫(yī)學(xué)數(shù)據(jù)因其極不平衡且特征維度高的特點(diǎn),使得傳統(tǒng)隨機(jī)森林算法在醫(yī)療領(lǐng)域的分類性能被嚴(yán)重削弱,同時(shí)隨機(jī)森林本身需要構(gòu)建多棵決策樹,導(dǎo)致運(yùn)算時(shí)間較長。針對(duì)上述問題,本文深入的分析和研究了隨機(jī)森林算法在醫(yī)療診斷領(lǐng)域的應(yīng)用,提出了幾點(diǎn)針對(duì)性的算法改進(jìn),最后設(shè)計(jì)并實(shí)現(xiàn)了一套針對(duì)敗血癥的醫(yī)療輔助診斷系統(tǒng),主要工作如下:首先,針對(duì)醫(yī)療數(shù)據(jù)極不平衡且特征維度高的特點(diǎn),提出了一種基于特征約簡的隨機(jī)森林改進(jìn)算法RW_RF(Relief F&Wrapper Random Forest)。使用改進(jìn)的Relief F算法將特征按分類能力進(jìn)行區(qū)分,在隨機(jī)森林構(gòu)建過程中,分層抽取特征并遞歸地訓(xùn)練決策樹,直到子樹分類性能達(dá)到最佳。實(shí)驗(yàn)證明,RW_RF算法比傳統(tǒng)隨機(jī)森林算法有更好的分類精度,在不平衡數(shù)據(jù)中也有很好的表現(xiàn)。其次,為減輕算法的時(shí)間復(fù)雜度,提出了一種基于Spark的改進(jìn)隨機(jī)森林算法,對(duì)RW_RF算法的兩處進(jìn)行并行...
【文章頁數(shù)】:69 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 課題研究背景及意義
1.2 研究現(xiàn)狀及發(fā)展趨勢(shì)
1.2.1 大數(shù)據(jù)在醫(yī)療診斷方面的研究現(xiàn)狀及發(fā)展趨勢(shì)
1.2.2 隨機(jī)森林算法研究現(xiàn)狀及發(fā)展趨勢(shì)
1.2.3 Spark研究現(xiàn)狀及趨勢(shì)
1.3 研究內(nèi)容及主要工作
1.4 結(jié)構(gòu)安排
第二章 相關(guān)背景知識(shí)介紹
2.1 隨機(jī)森林算法介紹
2.1.1 決策樹
2.1.2 隨機(jī)森林定義
2.1.3 隨機(jī)森林構(gòu)建過程
2.1.4 隨機(jī)森林算法評(píng)價(jià)
2.2 分布式相關(guān)技術(shù)介紹
2.2.1 Hadoop相關(guān)技術(shù)介紹
2.2.2 Spark相關(guān)技術(shù)介紹
2.3 分類問題評(píng)價(jià)指標(biāo)介紹
2.3.1 分類問題的評(píng)價(jià)指標(biāo)
2.3.2 分布式系統(tǒng)特性與衡量標(biāo)準(zhǔn)
2.4 本章小結(jié)
第三章 基于特征約簡的隨機(jī)森林改進(jìn)算法
3.1 基于改進(jìn)Relief F的隨機(jī)森林算法
3.1.1 改進(jìn)的Relief F算法
3.1.2 改進(jìn)的Relief F算法與隨機(jī)森林相結(jié)合
3.2 基于Wrapper思想的改進(jìn)隨機(jī)森林算法
3.2.1 Wrapper遞歸思想
3.2.2 改進(jìn)特征選擇法與隨機(jī)森林算法結(jié)合的RWRF算法
3.3 實(shí)驗(yàn)分析
3.3.1 實(shí)驗(yàn)數(shù)據(jù)集
3.3.2 實(shí)驗(yàn)過程
3.3.3 實(shí)驗(yàn)結(jié)果分析
3.4 本章小結(jié)
第四章 改進(jìn)隨機(jī)森林算法的并行化設(shè)計(jì)
4.1 RWRF算法的并行化設(shè)計(jì)
4.1.1 特征權(quán)重計(jì)算的并行化設(shè)計(jì)
4.1.2 隨機(jī)森林分布式實(shí)現(xiàn)步驟
4.2 實(shí)驗(yàn)驗(yàn)證
4.2.1 實(shí)驗(yàn)環(huán)境及條件
4.2.2 實(shí)驗(yàn)結(jié)果與分析
4.3 本章小結(jié)
第五章 敗血癥輔助診斷系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)
5.1 系統(tǒng)應(yīng)用領(lǐng)域介紹
5.2 數(shù)據(jù)采集與處理
5.2.1 數(shù)據(jù)采集
5.2.2 數(shù)據(jù)預(yù)處理
5.3 系統(tǒng)構(gòu)建
5.3.1 獲取分類規(guī)則
5.3.2 規(guī)則評(píng)估
5.3.3 疾病診斷預(yù)測(cè)
5.4 應(yīng)用結(jié)果分析
5.4.1 敗血癥數(shù)據(jù)集預(yù)處理
5.4.2 實(shí)驗(yàn)結(jié)果分析
5.5 本章小結(jié)
第六章 總結(jié)與展望
參考文獻(xiàn)
附錄1 攻讀碩士學(xué)位期間撰寫的論文
致謝
本文編號(hào):3988777
【文章頁數(shù)】:69 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 課題研究背景及意義
1.2 研究現(xiàn)狀及發(fā)展趨勢(shì)
1.2.1 大數(shù)據(jù)在醫(yī)療診斷方面的研究現(xiàn)狀及發(fā)展趨勢(shì)
1.2.2 隨機(jī)森林算法研究現(xiàn)狀及發(fā)展趨勢(shì)
1.2.3 Spark研究現(xiàn)狀及趨勢(shì)
1.3 研究內(nèi)容及主要工作
1.4 結(jié)構(gòu)安排
第二章 相關(guān)背景知識(shí)介紹
2.1 隨機(jī)森林算法介紹
2.1.1 決策樹
2.1.2 隨機(jī)森林定義
2.1.3 隨機(jī)森林構(gòu)建過程
2.1.4 隨機(jī)森林算法評(píng)價(jià)
2.2 分布式相關(guān)技術(shù)介紹
2.2.1 Hadoop相關(guān)技術(shù)介紹
2.2.2 Spark相關(guān)技術(shù)介紹
2.3 分類問題評(píng)價(jià)指標(biāo)介紹
2.3.1 分類問題的評(píng)價(jià)指標(biāo)
2.3.2 分布式系統(tǒng)特性與衡量標(biāo)準(zhǔn)
2.4 本章小結(jié)
第三章 基于特征約簡的隨機(jī)森林改進(jìn)算法
3.1 基于改進(jìn)Relief F的隨機(jī)森林算法
3.1.1 改進(jìn)的Relief F算法
3.1.2 改進(jìn)的Relief F算法與隨機(jī)森林相結(jié)合
3.2 基于Wrapper思想的改進(jìn)隨機(jī)森林算法
3.2.1 Wrapper遞歸思想
3.2.2 改進(jìn)特征選擇法與隨機(jī)森林算法結(jié)合的RWRF算法
3.3 實(shí)驗(yàn)分析
3.3.1 實(shí)驗(yàn)數(shù)據(jù)集
3.3.2 實(shí)驗(yàn)過程
3.3.3 實(shí)驗(yàn)結(jié)果分析
3.4 本章小結(jié)
第四章 改進(jìn)隨機(jī)森林算法的并行化設(shè)計(jì)
4.1 RWRF算法的并行化設(shè)計(jì)
4.1.1 特征權(quán)重計(jì)算的并行化設(shè)計(jì)
4.1.2 隨機(jī)森林分布式實(shí)現(xiàn)步驟
4.2 實(shí)驗(yàn)驗(yàn)證
4.2.1 實(shí)驗(yàn)環(huán)境及條件
4.2.2 實(shí)驗(yàn)結(jié)果與分析
4.3 本章小結(jié)
第五章 敗血癥輔助診斷系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)
5.1 系統(tǒng)應(yīng)用領(lǐng)域介紹
5.2 數(shù)據(jù)采集與處理
5.2.1 數(shù)據(jù)采集
5.2.2 數(shù)據(jù)預(yù)處理
5.3 系統(tǒng)構(gòu)建
5.3.1 獲取分類規(guī)則
5.3.2 規(guī)則評(píng)估
5.3.3 疾病診斷預(yù)測(cè)
5.4 應(yīng)用結(jié)果分析
5.4.1 敗血癥數(shù)據(jù)集預(yù)處理
5.4.2 實(shí)驗(yàn)結(jié)果分析
5.5 本章小結(jié)
第六章 總結(jié)與展望
參考文獻(xiàn)
附錄1 攻讀碩士學(xué)位期間撰寫的論文
致謝
本文編號(hào):3988777
本文鏈接:http://www.wukwdryxk.cn/guanlilunwen/lindaojc/3988777.html
最近更新
教材專著