時間序列數(shù)據(jù)挖掘中相似性和趨勢預(yù)測的研究
發(fā)布時間:2020-12-05 01:14
時間序列存在于社會的各個領(lǐng)域,對于時間序列數(shù)據(jù)挖掘的研究目前主要集中在相似性搜索和模式挖掘上。在相似性搜索研究中存在的主要問題是時間序列數(shù)據(jù)量過大,一個有效的解決辦法是對時間序列進(jìn)行重新描述,減小數(shù)據(jù)量。在模式挖掘方面,趨勢預(yù)測是一個比較新的思路,它從時間序列數(shù)據(jù)中抽取決定時間序列的行為發(fā)展趨勢的靜態(tài)屬性,組成靜態(tài)數(shù)據(jù)庫,然后將泛化性能較強(qiáng)的分類技術(shù)應(yīng)用于靜態(tài)數(shù)據(jù)庫中挖掘分類規(guī)則,對行為發(fā)展趨勢做出預(yù)測。相似性研究中有效的數(shù)據(jù)描述是提高相似性搜索效率的關(guān)鍵,本文第二章提出了一種結(jié)構(gòu)自適應(yīng)的時間序列分段線性化表示方法,該方法可以自動地產(chǎn)生線性化的段數(shù)K。大大壓縮了相似性的計算量。同時在分段線性化表示的基礎(chǔ)上提出了一種相似性計算方法,該方法對于時間序列的多種變形都不敏感。本文擬從時間序列數(shù)據(jù)庫中挖掘到表征時間序列發(fā)展趨勢的分類規(guī)則,首先必須對時間序列進(jìn)行靜態(tài)模式的抽取,得到分類屬性。本文就此在第三章深入闡述了靜態(tài)模式的抽取方法。以股票為主要的時間序列研究對象,抽取的靜態(tài)模式往往含有較多的干擾,因此需要分類工具必須有較強(qiáng)的泛化性能,為了解決這一問題在第四章采用正則最小二乘學(xué)習(xí)算法訓(xùn)練的前饋神...
【文章來源】:天津大學(xué)天津市 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:114 頁
【學(xué)位級別】:博士
【部分圖文】:
A圖為歐氏測量方法B圖為DTW測量方法
圖 1-3 扭曲路徑的例子列的重新描述上文提到的哪種測量方法,當(dāng)時間序列的數(shù)據(jù)量題,雖然相關(guān)性有一定的解決辦法,但是它也是之后再處理,因此也是一種時間序列的重新描述又不會丟失原有的信息,人們提出了幾種時間法列的信號往往是由各種不同頻率的信號疊加而序列的分析將是有效的,即將時域內(nèi)的數(shù)據(jù)轉(zhuǎn)換間序列的相似性,將保持?jǐn)?shù)據(jù)間歐幾里德距離不數(shù)據(jù)變換是必要的。通常,使用獨立于數(shù)據(jù)的變與輸入數(shù)據(jù)無關(guān)。其中兩個常見的獨立于數(shù)據(jù)的波變換(DWT)。由于在時域中兩個時間序列的
本文編號:2898595
【文章來源】:天津大學(xué)天津市 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:114 頁
【學(xué)位級別】:博士
【部分圖文】:
A圖為歐氏測量方法B圖為DTW測量方法
圖 1-3 扭曲路徑的例子列的重新描述上文提到的哪種測量方法,當(dāng)時間序列的數(shù)據(jù)量題,雖然相關(guān)性有一定的解決辦法,但是它也是之后再處理,因此也是一種時間序列的重新描述又不會丟失原有的信息,人們提出了幾種時間法列的信號往往是由各種不同頻率的信號疊加而序列的分析將是有效的,即將時域內(nèi)的數(shù)據(jù)轉(zhuǎn)換間序列的相似性,將保持?jǐn)?shù)據(jù)間歐幾里德距離不數(shù)據(jù)變換是必要的。通常,使用獨立于數(shù)據(jù)的變與輸入數(shù)據(jù)無關(guān)。其中兩個常見的獨立于數(shù)據(jù)的波變換(DWT)。由于在時域中兩個時間序列的
本文編號:2898595
本文鏈接:http://www.wukwdryxk.cn/jingjifazhanlunwen/2898595.html
最近更新
教材專著