一種新分類模型運用于不平衡分類
【學位單位】:華中科技大學
【學位級別】:碩士
【學位年份】:2017
【中圖分類】:C815
【部分圖文】:
集成學習(ensemble learning)[12]是通過訓練多個分類器,最后用某種組合策略來組合分類器來完成分類任務。對于集成學習如何才能使其優(yōu)于單一的分類器,主要是保證個體分類器的準確性和多樣性。集成學習可以大致分為兩大類:Boosting(個體分類器間之間存在強依賴關系)和 Bagging(個體分類器間之間不存在強依賴關系)。Boosting 的主要算法思想是,首先基于初始訓練集訓練出一個分類器,之后改變訓練集的權重,加大錯分類的樣本的權重,接著基于改變后的訓練集再訓練出分類器,然后一直如此重復進行,直到訓練出 T 個分類器停止,最終結合 T 個分類器對樣本進行分類。AdaBoost[13]是 Boosting 的一個著名的代表算法。Bagging[14]的主要步驟有,從數據集中隨機自助采樣 m 個樣本作為訓練集,并基于訓練集訓練出分類模型,重復該步驟 T 次,最后將 T 個分類模型結合起來。而更進一步,隨機森林[15](RandomForest)是 Bagging 的擴展變體,并且在大多數分類問題中效果都是非常出色的。集成學習示意圖展示如下:
圖 1-2 OvO 與 OvR 示意圖以上介紹的兩種方法有一個問題是對二分類的錯誤太敏感,即如果有一個二分類器誤判,則整個組合的結果就會出現誤判。Dietterich 和 Bakiri[16]提出了一種魯棒的方法糾錯輸出編碼( error-correcting output coding, ECOC),其基本思想是借助于代碼字向傳輸信息中增加一些冗余,從而使得接收方能發(fā)現接收信息中的一些錯誤,而且如果錯誤量很少,還可能恢復原始信息。接著介紹徑向基函數插值的研究現狀。徑向基函數是指以距離為變量的函數集合,并且具有各向同性、形式簡單、維數無關以及無網格等特點。1971 年,一位大地測量學家 Hardy[17]介紹了一種名叫 Multi-Quadratic(MQ)函數用于地貌形狀的曲面擬合問題。航空航天工程師 Harder R L 和 Desmarais R N[18]在航空器設計過程中于1972 年提出了一種名叫 thin plate splines(TPS)函數。這些都開啟了徑向基函數的研究。
圖 3-4 10 折交叉驗證示意圖由于新分類模型中徑向基函數是一類函數,本文選取了四個函數分別分類模型 I 類,新分類模型 II 類,新分類模型 III 類和新分類模型 IV 類,進尋找最佳模型。下面依次介紹這些模型的實驗結果。新分類模型 I 類是取徑向基函數為高斯函數,即φ( ) ( ) 2, ∈ 狀參數 是和正態(tài)分布函數的方差有關系,即 21 (2 2)。結合距離函數于某個固定的中心點 ∈ ,函數形式變?yōu)?(‖ ‖2) 2‖ ‖22, ∈ 對于設置參數 ,在本文實驗中取的是訓練樣本的特征向量。則新分類 ( ) ∑ (‖ ‖2 1) ∑ 1 2‖ ‖22其中 表示訓練集的樣本數目。
【相似文獻】
相關期刊論文 前10條
1 冷漠;;藝術發(fā)展的社會性[J];北方音樂;2017年13期
2 鄒力行;;重視平衡創(chuàng)新[J];中國科技產業(yè);2016年06期
3 ;奮進新時代[J];實踐與跨越;2017年03期
4 阿達麗;;逃離北京后,兒子對現在的學校各種挑剔[J];婚姻與家庭(社會紀實);2017年03期
5 楊麗;;觀察探究不能“由己推人”[J];學前教育;2017年01期
6 黃菊芳;;探析六年級英語課堂縮小兩極分化的策略[J];新課程(小學);2017年05期
7 兩色風景;吳懷銀;;長跑囧事[J];兒童故事畫報;2017年21期
8 伍君儀;;心臟不好,慎練上肢[J];戀愛婚姻家庭.養(yǎng)生;2017年05期
9 閔保華;;心態(tài)平衡才能安度晚年[J];家庭醫(yī)藥.快樂養(yǎng)生;2017年06期
10 劉墉;;觀人[J];意林;2017年16期
相關博士學位論文 前10條
1 文博;中國經常項目不平衡研究[D];西南財經大學;2008年
2 艾旭升;基于免疫系統的不平衡數據分類方法研究[D];蘇州大學;2016年
3 王瑞;針對類別不平衡和代價敏感分類問題的特征選擇和分類算法[D];中國科學技術大學;2013年
4 楊澤平;基于神經網絡的不平衡數據分類方法研究[D];華東理工大學;2015年
5 劉珍;因特網流量類不平衡特性與分類方法的研究[D];華南理工大學;2013年
6 渠瑜;基于SVM的高不平衡分類技術研究及其在電信業(yè)的應用[D];浙江大學;2010年
7 李鳳岐;基于半監(jiān)督學習的不平衡數據分類算法與應用[D];大連理工大學;2014年
8 陳雷;射頻非理想特性的基帶補償技術研究[D];電子科技大學;2017年
9 安錦香;地方政府競爭與外資分布的不平衡性研究[D];大連理工大學;2013年
10 譚智力;不平衡及非線性條件下三相四線UPQC的控制策略研究[D];華中科技大學;2007年
相關碩士學位論文 前10條
1 陳星星;一種新分類模型運用于不平衡分類[D];華中科技大學;2017年
2 王思南;SVG在低壓配電網三相不平衡治理中的應用研究[D];北京交通大學;2018年
3 李延東;高增益三態(tài)CSI及其電網電壓不平衡控制策略研究[D];合肥工業(yè)大學;2018年
4 李坤奇;不平衡電網條件下的三相PWM整流器控制策略研究[D];蘭州交通大學;2018年
5 羅芳;不平衡電源條件下三相PWM整流無源性控制研究[D];華南理工大學;2018年
6 杜錦波;基于快速文本分類器與不平衡數據的研究[D];暨南大學;2018年
7 王非一;OFDM系統中的IQ不平衡補償算法研究[D];國防科學技術大學;2016年
8 殷昊;面向微博文本的情緒識別和分類方法研究[D];蘇州大學;2018年
9 高亞靜;基于對比模式的不平衡數據分類研究[D];湖南大學;2018年
10 周建偉;不平衡學習中的重采樣方法研究[D];南京理工大學;2018年
本文編號:2859578
本文鏈接:http://www.wukwdryxk.cn/guanlilunwen/tongjijuecelunwen/2859578.html