a国产,中文字幕久久波多野结衣AV,欧美粗大猛烈老熟妇,女人av天堂

當(dāng)前位置:主頁 > 管理論文 > 統(tǒng)計學(xué)論文 >

一種新分類模型運用于不平衡分類

發(fā)布時間:2020-10-28 04:20
   不平衡多分類問題是目前分類問題中的研究的一個熱點,有著廣泛的應(yīng)用背景,如異常檢測、疾病診斷等等。同時,不平衡多分類問題也是分類問題中的一個難點。首先,它的樣本分布不均勻,不同類別之間樣本數(shù)目差別大;其次,它又是一個多分類問題。本文創(chuàng)新地構(gòu)建了一種新分類模型,對于解決不平衡多分類問題取得了不錯的效果。本文采用了醫(yī)學(xué)診斷方面一個的數(shù)據(jù)集Arrhythmia。該數(shù)據(jù)集由452個患者記錄組成,每個記錄總共有279個特征值,目標(biāo)是將數(shù)據(jù)集分類為16類。其中,類別的分布不均勻,正常的類別占整個數(shù)據(jù)集的一半多,而有的類別的占比不及1%。面對這樣的一個數(shù)據(jù)集,本文創(chuàng)建了一種新分類模型,該模型是結(jié)合徑向基函數(shù)插值和邏輯回歸的算法思想而成的。為了尋找到最優(yōu)的新分類模型,本文對新分類模型取了四種不同的徑向基函數(shù):高斯函數(shù),Markoff分布函數(shù),一次多項式函數(shù)和最簡單的函數(shù),在不同的參數(shù)下進行實驗。最終得出,新分類模型在取一次多項式函數(shù)的形式下,相應(yīng)的一次項系數(shù)c取10,懲罰項調(diào)節(jié)系數(shù)取1時,模型性能達到最佳,分類準(zhǔn)確率高達76.01%。為了便于比較,本文還做了補充實驗,將徑向基函數(shù)插值和邏輯回歸應(yīng)用于該數(shù)據(jù)集。并且,對比了之前別人對這個數(shù)據(jù)集用不同分類器分類的效果。最后發(fā)現(xiàn),新分類模型的分類效果是最好的。
【學(xué)位單位】:華中科技大學(xué)
【學(xué)位級別】:碩士
【學(xué)位年份】:2017
【中圖分類】:C815
【部分圖文】:

示意圖,集成學(xué)習(xí),示意圖,分類器


集成學(xué)習(xí)(ensemble learning)[12]是通過訓(xùn)練多個分類器,最后用某種組合策略來組合分類器來完成分類任務(wù)。對于集成學(xué)習(xí)如何才能使其優(yōu)于單一的分類器,主要是保證個體分類器的準(zhǔn)確性和多樣性。集成學(xué)習(xí)可以大致分為兩大類:Boosting(個體分類器間之間存在強依賴關(guān)系)和 Bagging(個體分類器間之間不存在強依賴關(guān)系)。Boosting 的主要算法思想是,首先基于初始訓(xùn)練集訓(xùn)練出一個分類器,之后改變訓(xùn)練集的權(quán)重,加大錯分類的樣本的權(quán)重,接著基于改變后的訓(xùn)練集再訓(xùn)練出分類器,然后一直如此重復(fù)進行,直到訓(xùn)練出 T 個分類器停止,最終結(jié)合 T 個分類器對樣本進行分類。AdaBoost[13]是 Boosting 的一個著名的代表算法。Bagging[14]的主要步驟有,從數(shù)據(jù)集中隨機自助采樣 m 個樣本作為訓(xùn)練集,并基于訓(xùn)練集訓(xùn)練出分類模型,重復(fù)該步驟 T 次,最后將 T 個分類模型結(jié)合起來。而更進一步,隨機森林[15](RandomForest)是 Bagging 的擴展變體,并且在大多數(shù)分類問題中效果都是非常出色的。集成學(xué)習(xí)示意圖展示如下:

示意圖,示意圖,徑向基函數(shù),代碼字


圖 1-2 OvO 與 OvR 示意圖以上介紹的兩種方法有一個問題是對二分類的錯誤太敏感,即如果有一個二分類器誤判,則整個組合的結(jié)果就會出現(xiàn)誤判。Dietterich 和 Bakiri[16]提出了一種魯棒的方法糾錯輸出編碼( error-correcting output coding, ECOC),其基本思想是借助于代碼字向傳輸信息中增加一些冗余,從而使得接收方能發(fā)現(xiàn)接收信息中的一些錯誤,而且如果錯誤量很少,還可能恢復(fù)原始信息。接著介紹徑向基函數(shù)插值的研究現(xiàn)狀。徑向基函數(shù)是指以距離為變量的函數(shù)集合,并且具有各向同性、形式簡單、維數(shù)無關(guān)以及無網(wǎng)格等特點。1971 年,一位大地測量學(xué)家 Hardy[17]介紹了一種名叫 Multi-Quadratic(MQ)函數(shù)用于地貌形狀的曲面擬合問題。航空航天工程師 Harder R L 和 Desmarais R N[18]在航空器設(shè)計過程中于1972 年提出了一種名叫 thin plate splines(TPS)函數(shù)。這些都開啟了徑向基函數(shù)的研究。

示意圖,交叉驗證,新分類,示意圖


圖 3-4 10 折交叉驗證示意圖由于新分類模型中徑向基函數(shù)是一類函數(shù),本文選取了四個函數(shù)分別分類模型 I 類,新分類模型 II 類,新分類模型 III 類和新分類模型 IV 類,進尋找最佳模型。下面依次介紹這些模型的實驗結(jié)果。新分類模型 I 類是取徑向基函數(shù)為高斯函數(shù),即φ( ) ( ) 2, ∈ 狀參數(shù) 是和正態(tài)分布函數(shù)的方差有關(guān)系,即 21 (2 2)。結(jié)合距離函數(shù)于某個固定的中心點 ∈ ,函數(shù)形式變?yōu)?(‖ ‖2) 2‖ ‖22, ∈ 對于設(shè)置參數(shù) ,在本文實驗中取的是訓(xùn)練樣本的特征向量。則新分類 ( ) ∑ (‖ ‖2 1) ∑ 1 2‖ ‖22其中 表示訓(xùn)練集的樣本數(shù)目。
【相似文獻】

相關(guān)期刊論文 前10條

1 冷漠;;藝術(shù)發(fā)展的社會性[J];北方音樂;2017年13期

2 鄒力行;;重視平衡創(chuàng)新[J];中國科技產(chǎn)業(yè);2016年06期

3 ;奮進新時代[J];實踐與跨越;2017年03期

4 阿達麗;;逃離北京后,兒子對現(xiàn)在的學(xué)校各種挑剔[J];婚姻與家庭(社會紀(jì)實);2017年03期

5 楊麗;;觀察探究不能“由己推人”[J];學(xué)前教育;2017年01期

6 黃菊芳;;探析六年級英語課堂縮小兩極分化的策略[J];新課程(小學(xué));2017年05期

7 兩色風(fēng)景;吳懷銀;;長跑囧事[J];兒童故事畫報;2017年21期

8 伍君儀;;心臟不好,慎練上肢[J];戀愛婚姻家庭.養(yǎng)生;2017年05期

9 閔保華;;心態(tài)平衡才能安度晚年[J];家庭醫(yī)藥.快樂養(yǎng)生;2017年06期

10 劉墉;;觀人[J];意林;2017年16期


相關(guān)博士學(xué)位論文 前10條

1 文博;中國經(jīng)常項目不平衡研究[D];西南財經(jīng)大學(xué);2008年

2 艾旭升;基于免疫系統(tǒng)的不平衡數(shù)據(jù)分類方法研究[D];蘇州大學(xué);2016年

3 王瑞;針對類別不平衡和代價敏感分類問題的特征選擇和分類算法[D];中國科學(xué)技術(shù)大學(xué);2013年

4 楊澤平;基于神經(jīng)網(wǎng)絡(luò)的不平衡數(shù)據(jù)分類方法研究[D];華東理工大學(xué);2015年

5 劉珍;因特網(wǎng)流量類不平衡特性與分類方法的研究[D];華南理工大學(xué);2013年

6 渠瑜;基于SVM的高不平衡分類技術(shù)研究及其在電信業(yè)的應(yīng)用[D];浙江大學(xué);2010年

7 李鳳岐;基于半監(jiān)督學(xué)習(xí)的不平衡數(shù)據(jù)分類算法與應(yīng)用[D];大連理工大學(xué);2014年

8 陳雷;射頻非理想特性的基帶補償技術(shù)研究[D];電子科技大學(xué);2017年

9 安錦香;地方政府競爭與外資分布的不平衡性研究[D];大連理工大學(xué);2013年

10 譚智力;不平衡及非線性條件下三相四線UPQC的控制策略研究[D];華中科技大學(xué);2007年


相關(guān)碩士學(xué)位論文 前10條

1 陳星星;一種新分類模型運用于不平衡分類[D];華中科技大學(xué);2017年

2 王思南;SVG在低壓配電網(wǎng)三相不平衡治理中的應(yīng)用研究[D];北京交通大學(xué);2018年

3 李延?xùn)|;高增益三態(tài)CSI及其電網(wǎng)電壓不平衡控制策略研究[D];合肥工業(yè)大學(xué);2018年

4 李坤奇;不平衡電網(wǎng)條件下的三相PWM整流器控制策略研究[D];蘭州交通大學(xué);2018年

5 羅芳;不平衡電源條件下三相PWM整流無源性控制研究[D];華南理工大學(xué);2018年

6 杜錦波;基于快速文本分類器與不平衡數(shù)據(jù)的研究[D];暨南大學(xué);2018年

7 王非一;OFDM系統(tǒng)中的IQ不平衡補償算法研究[D];國防科學(xué)技術(shù)大學(xué);2016年

8 殷昊;面向微博文本的情緒識別和分類方法研究[D];蘇州大學(xué);2018年

9 高亞靜;基于對比模式的不平衡數(shù)據(jù)分類研究[D];湖南大學(xué);2018年

10 周建偉;不平衡學(xué)習(xí)中的重采樣方法研究[D];南京理工大學(xué);2018年



本文編號:2859578

資料下載
論文發(fā)表

本文鏈接:http://www.wukwdryxk.cn/guanlilunwen/tongjijuecelunwen/2859578.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶c06a1***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com
三原县| 国产亚洲精品AA片在线观看网站| 蜜臀av性久久久久蜜臀aⅴ流畅 | 女人高潮内射99精品| 久久人人爽人人爽人人片av超碰| 日本中文字幕亚洲乱码| 国99精品无码一区二区三区| 一级a一级a爰片免费免免在线| 91久久精品日日躁夜夜躁国产| 久久久电影| 8090yy成人免费看片| 亚洲涩涩涩| 骚熟妇| 久青草影院| 成人欧美日韩| 日日撸夜夜撸| 超碰成人福利| 少妇做爰xxxx九色| 国产乱肥熟妇免费av| 亚洲少妇色图| 色成人亚洲| 性做久久久久久久久| 国产精品毛片久久久| 少妇熟女av| 精品人妻伦一二三区久久| 蜜桃bbwbbwbbwbbw| www.亚洲av.com| 少妇xxxx| 国产精品久久久久精品三级下载| 久久国产| 门源| 精品无人区一区二区三区| 亚洲熟妇无码av另类vr影视| 亚洲国产精品嫩草影院久久| 亚洲av中文无码乱人伦在线r▽| 国产乱子伦无套一区二区三区 | 日本另类αv欧美另类aⅴ| 久久精品国产精品国产精品污| 天天操夜夜操| 欧美日韩免费高清一区色橹橹| 欧美日韩精品|