流數(shù)據(jù)概念漂移及演化的檢測(cè)方法研究
發(fā)布時(shí)間:2024-04-27 05:16
隨著信息采集和數(shù)據(jù)處理技術(shù)的深入推進(jìn),流數(shù)據(jù)已成為數(shù)據(jù)挖掘領(lǐng)域的一種重要存在形式,其最大的特點(diǎn)就是帶有時(shí)間標(biāo)記,因此也稱作時(shí)間序列數(shù)據(jù)。由于流數(shù)據(jù)的動(dòng)態(tài)多變特性,其所蘊(yùn)含的概念分布會(huì)隨著時(shí)間或環(huán)境變化而發(fā)生改變,如:數(shù)據(jù)源的分布變化可能導(dǎo)致隱含的概念知識(shí)與原始數(shù)據(jù)不同,即發(fā)生概念漂移;數(shù)據(jù)源產(chǎn)生機(jī)制變化可能導(dǎo)致數(shù)據(jù)中有新的模式類別出現(xiàn),即發(fā)生概念演化。針對(duì)非穩(wěn)態(tài)環(huán)境下流數(shù)據(jù)存在的不同概念變化問(wèn)題,設(shè)計(jì)有效的流數(shù)據(jù)概念漂移及演化檢測(cè)方法,有助于深入研究概念漂移及演化的本質(zhì)特征,對(duì)于流數(shù)據(jù)的深入分析挖掘具有重要意義。本文針對(duì)概念漂移及概念演化的檢測(cè)問(wèn)題開(kāi)展研究,具體研究?jī)?nèi)容包括兩個(gè)方面:(1)針對(duì)流數(shù)據(jù)中同時(shí)存在的由樣本分布穩(wěn)定變化引起的真實(shí)概念漂移和由樣本噪聲及隨機(jī)波動(dòng)引起的偽概念漂移,提出一種基于在線性能測(cè)試的真?zhèn)胃拍钇茩z測(cè)方法。該方法主要包括通過(guò)監(jiān)測(cè)分類性能捕獲有效波動(dòng)位點(diǎn)、通過(guò)分組交叉測(cè)試提取一致波動(dòng)位點(diǎn)和通過(guò)漂移位點(diǎn)的后續(xù)參考位點(diǎn)進(jìn)行真?zhèn)涡耘卸ㄈ齻(gè)核心模塊。該方法采用分組交叉測(cè)試對(duì)流數(shù)據(jù)的測(cè)試性能分布波動(dòng)進(jìn)行分析,消除了流數(shù)據(jù)中存在的正常隨機(jī)波動(dòng)導(dǎo)致的偽概念漂移對(duì)真實(shí)概念漂移檢...
【文章頁(yè)數(shù)】:70 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
中文摘要
Abstract
第一章 引言
1.1 研究背景
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.2.1 概念漂移研究現(xiàn)狀
1.2.2 概念演化研究現(xiàn)狀
1.3 論文主要工作
第二章 背景知識(shí)
2.1 概念漂移
2.1.1 概念漂移定義
2.1.2 概念漂移檢測(cè)
2.2 概念演化
2.2.1 概念演化定義
2.2.2 概念演化檢測(cè)
2.3 本章小結(jié)
第三章 基于在線性能測(cè)試的真?zhèn)胃拍钇茩z測(cè)
3.1 真?zhèn)胃拍钇泼枋雠c分析
3.2 基于在線性能測(cè)試的真?zhèn)胃拍钇茩z測(cè)方法
3.2.1 有效波動(dòng)位點(diǎn)檢測(cè)
3.2.2 一致波動(dòng)位點(diǎn)提取
3.2.3 概念漂移位點(diǎn)判定
3.2.4 基于在線性能測(cè)試的真?zhèn)胃拍钇茩z測(cè)算法
3.3 實(shí)驗(yàn)與結(jié)果分析
3.3.1 數(shù)據(jù)描述與實(shí)驗(yàn)設(shè)置
3.3.2 概念漂移檢測(cè)評(píng)測(cè)指標(biāo)
3.3.3 實(shí)驗(yàn)結(jié)果及分析
3.4 本章小結(jié)
第四章 基于完全隨機(jī)森林的概念演化檢測(cè)
4.1 隨機(jī)森林模型
4.2 基于完全隨機(jī)森林的概念演化檢測(cè)
4.2.1 異常樣本檢測(cè)
4.2.2 新類樣本標(biāo)記
4.2.3 在線異常檢測(cè)更新
4.3 實(shí)驗(yàn)與結(jié)果分析
4.3.1 數(shù)據(jù)描述與實(shí)驗(yàn)設(shè)置
4.3.2 概念演化評(píng)測(cè)指標(biāo)
4.3.3 實(shí)驗(yàn)結(jié)果及分析
4.4 本章小結(jié)
第五章 結(jié)論及展望
參考文獻(xiàn)
研究成果
致謝
個(gè)人簡(jiǎn)況及聯(lián)系方式
本文編號(hào):3965409
【文章頁(yè)數(shù)】:70 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
中文摘要
Abstract
第一章 引言
1.1 研究背景
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.2.1 概念漂移研究現(xiàn)狀
1.2.2 概念演化研究現(xiàn)狀
1.3 論文主要工作
第二章 背景知識(shí)
2.1 概念漂移
2.1.1 概念漂移定義
2.1.2 概念漂移檢測(cè)
2.2 概念演化
2.2.1 概念演化定義
2.2.2 概念演化檢測(cè)
2.3 本章小結(jié)
第三章 基于在線性能測(cè)試的真?zhèn)胃拍钇茩z測(cè)
3.1 真?zhèn)胃拍钇泼枋雠c分析
3.2 基于在線性能測(cè)試的真?zhèn)胃拍钇茩z測(cè)方法
3.2.1 有效波動(dòng)位點(diǎn)檢測(cè)
3.2.2 一致波動(dòng)位點(diǎn)提取
3.2.3 概念漂移位點(diǎn)判定
3.2.4 基于在線性能測(cè)試的真?zhèn)胃拍钇茩z測(cè)算法
3.3 實(shí)驗(yàn)與結(jié)果分析
3.3.1 數(shù)據(jù)描述與實(shí)驗(yàn)設(shè)置
3.3.2 概念漂移檢測(cè)評(píng)測(cè)指標(biāo)
3.3.3 實(shí)驗(yàn)結(jié)果及分析
3.4 本章小結(jié)
第四章 基于完全隨機(jī)森林的概念演化檢測(cè)
4.1 隨機(jī)森林模型
4.2 基于完全隨機(jī)森林的概念演化檢測(cè)
4.2.1 異常樣本檢測(cè)
4.2.2 新類樣本標(biāo)記
4.2.3 在線異常檢測(cè)更新
4.3 實(shí)驗(yàn)與結(jié)果分析
4.3.1 數(shù)據(jù)描述與實(shí)驗(yàn)設(shè)置
4.3.2 概念演化評(píng)測(cè)指標(biāo)
4.3.3 實(shí)驗(yàn)結(jié)果及分析
4.4 本章小結(jié)
第五章 結(jié)論及展望
參考文獻(xiàn)
研究成果
致謝
個(gè)人簡(jiǎn)況及聯(lián)系方式
本文編號(hào):3965409
本文鏈接:http://www.wukwdryxk.cn/shoufeilunwen/xixikjs/3965409.html
最近更新
教材專著