基于粗糙集成學習的半監(jiān)督屬性約簡
本文選題:屬性約簡 + 粗糙集。 參考:《小型微型計算機系統(tǒng)》2016年12期
【摘要】:屬性約簡是粗糙集理論重要研究內(nèi)容之一.Pawlak粗糙集約簡的對象一般是有監(jiān)督數(shù)據(jù)或者是無監(jiān)督數(shù)據(jù).而在很多現(xiàn)實問題中有標記數(shù)據(jù)很有限,更多的是無標記數(shù)據(jù),即半監(jiān)督數(shù)據(jù).僅利用有標記數(shù)據(jù)一般難以計算出質量較好的屬性約簡.為此,基于粗糙集理論,結合集成學習與半監(jiān)督學習,提出有效地利用無標記數(shù)據(jù)計算半監(jiān)督數(shù)據(jù)屬性約簡算法.該算法在有標記數(shù)據(jù)上構造一組差異性較大的屬性約簡構造集成基分類器,在半監(jiān)督自訓練學習過程中,用集成分類器對無標記數(shù)據(jù)做出預測,擴大有標記數(shù)據(jù)集,從而獲得質量更好的約簡.UCI數(shù)據(jù)集實驗分析表明該算法是有效可行的.
[Abstract]:Attribute reduction is one of the important research contents in rough set theory. The objects of Pawlak rough set reduction are generally supervised data or unsupervised data. In many practical problems, there are very limited labeled data, more is unlabeled data, that is, semi-supervised data. It is difficult to calculate attribute reduction with good quality only by using marked data. Based on rough set theory and integrated learning and semi-supervised learning, an effective attribute reduction algorithm for semi-supervised data is proposed by using unmarked data. In this algorithm, a group of attribute reduction on marked data is constructed to construct an ensemble base classifier. In the process of semi-supervised self-training and learning, an integrated classifier is used to predict the unmarked data and to expand the labeled data set. The experimental results of better quality reduction. UCI dataset show that the algorithm is effective and feasible.
【作者單位】: 同濟大學電子與信息工程學院計算機科學與技術系;上海電力學院計算機科學與技術學院;同濟大學嵌入式系統(tǒng)與服務計算教育部重點實驗室;深圳大學計算機與軟件學院;香港理工大學應用科學與紡織學院;
【基金】:國家自然科學基金項目(61273304)資助 2013年度高等學校博士學科點專項科研基金項目(20130072130004)資助
【分類號】:TP18
【相似文獻】
相關期刊論文 前10條
1 袁漢寧;;雙層多示例集成學習[J];武漢理工大學學報(信息與管理工程版);2011年05期
2 俞揚;周志華;;集成學習中完全隨機學習策略研究[J];計算機工程;2006年17期
3 張滄生;崔麗娟;楊剛;倪志宏;;集成學習算法的比較研究[J];河北大學學報(自然科學版);2007年05期
4 陳凱;;基于聚類技術的集成學習差異性研究[J];南京工業(yè)職業(yè)技術學院學報;2008年04期
5 李凱;崔麗娟;;集成學習算法的差異性及性能比較[J];計算機工程;2008年06期
6 潘志松;燕繼坤;;少數(shù)類的集成學習[J];南京航空航天大學學報;2009年04期
7 陳凱;馬景義;;一種選擇性SER-BagBoosting Trees集成學習研究[J];計算機科學;2009年09期
8 陳全;趙文輝;李潔;江雨燕;;選擇性集成學習算法的研究[J];計算機技術與發(fā)展;2010年02期
9 張燕平;曹振田;趙姝;鄭堯軍;杜玲;竇蓉蓉;;一種新的決策樹選擇性集成學習方法[J];計算機工程與應用;2010年17期
10 饒峰;;核機器集成學習算法的誤差分析[J];重慶文理學院學報(自然科學版);2010年04期
相關會議論文 前3條
1 關菁華;劉大有;賈海洋;;自適應多分類器集成學習算法[A];第二十五屆中國數(shù)據(jù)庫學術會議論文集(二)[C];2008年
2 葉紅云;倪志偉;陳恩紅;;一種混合型集成學習演化決策樹算法[A];2005年“數(shù)字安徽”博士科技論壇論文集[C];2005年
3 李燁;蔡云澤;許曉鳴;;基于支持向量機集成的故障診斷[A];第16屆中國過程控制學術年會暨第4屆全國故障診斷與安全性學術會議論文集[C];2005年
相關博士學位論文 前10條
1 王永明;集成回歸問題若干關鍵技術研究[D];華東師范大學;2015年
2 常征;基于混合集成學習的眼部與四肢交互動作建模與識別[D];北京科技大學;2016年
3 張春霞;集成學習中有關算法的研究[D];西安交通大學;2010年
4 劉天羽;基于特征選擇技術的集成學習方法及其應用研究[D];上海大學;2007年
5 尹華;面向高維和不平衡數(shù)據(jù)分類的集成學習研究[D];武漢大學;2012年
6 王清;集成學習中若干關鍵問題的研究[D];復旦大學;2011年
7 方育柯;集成學習理論研究及其在個性化推薦中的應用[D];電子科技大學;2011年
8 侯勇;特征提取與集成學習算法的研究及應用[D];北京科技大學;2015年
9 李燁;基于支持向量機的集成學習研究[D];上海交通大學;2007年
10 程麗麗;支持向量機集成學習算法研究[D];哈爾濱工程大學;2009年
相關碩士學位論文 前10條
1 王希玲;基于選擇性集成學習的網(wǎng)絡入侵檢測方法研究[D];青島科技大學;2016年
2 張妤;支持向量機集成學習方法研究[D];山西大學;2008年
3 李濤;基于條件互信息的集成學習的研究與應用[D];中國海洋大學;2009年
4 楊長盛;基于成對差異性度量的選擇性集成學習方法研究[D];安徽大學;2010年
5 曹振田;基于Q統(tǒng)計量的選擇性集成學習研究[D];安徽大學;2010年
6 王麗麗;集成學習算法研究[D];廣西大學;2006年
7 馬冉冉;集成學習算法研究[D];山東科技大學;2010年
8 張新東;集成學習及其應用研究[D];石家莊經(jīng)濟學院;2010年
9 吳科主;基于多任務的多層次選擇性集成學習的研究[D];安徽工業(yè)大學;2010年
10 李平;集成學習中差異性控制方法研究[D];大連海事大學;2012年
,本文編號:1959581
本文鏈接:http://www.wukwdryxk.cn/kejilunwen/zidonghuakongzhilunwen/1959581.html