基于主成分分析的基因表達(dá)譜數(shù)據(jù)降維方法研究及可視化
發(fā)布時(shí)間:2020-12-04 18:07
“21世紀(jì)是生物技術(shù)的世紀(jì)”,隨著時(shí)代的發(fā)展,基因測(cè)序技術(shù)及其他生物信息學(xué)技術(shù)正在改變著世界。其中基因表達(dá)譜數(shù)據(jù)收集和處理技術(shù)已經(jīng)越來越成熟和多樣,海量數(shù)據(jù)的規(guī)模和復(fù)雜度在不斷增加,例如:基因組數(shù)據(jù)庫、核酸和蛋白質(zhì)結(jié)構(gòu)序列數(shù)據(jù)庫、生物大分子空間結(jié)構(gòu)信息等。然而隨著“大數(shù)據(jù)時(shí)代”的來臨,問題也隨之而來,如此大規(guī)模的數(shù)據(jù)帶來的更多的是高維、海量和不完整性等巨大挑戰(zhàn)。關(guān)于基因表達(dá)譜數(shù)據(jù)降維技術(shù)的創(chuàng)新與研究也在不斷地更新迭代,并取得了可觀的成果。主成分回歸分析作為一種經(jīng)典的算法得到了非常廣泛的應(yīng)用,并且針對(duì)不同領(lǐng)域演變出了許多改進(jìn)和變種算法。但是它們主要是針對(duì)樣本數(shù)據(jù)本身進(jìn)行優(yōu)化和改進(jìn),并沒有將其與分類標(biāo)簽結(jié)合起來,這就容易導(dǎo)致丟失感興趣目標(biāo)信息,無法良好地發(fā)現(xiàn)數(shù)據(jù)潛在的內(nèi)部結(jié)構(gòu)關(guān)系,進(jìn)而影響預(yù)測(cè)和分類性能。針對(duì)此類問題,課題研究了有監(jiān)督主成分回歸(Supervised Principal Component Regression SPCR)和基于Y-aware的主成分回歸方法,驗(yàn)證了其相對(duì)于PCR方法的優(yōu)越性。通過實(shí)驗(yàn)發(fā)現(xiàn),SPCR方法隨著保留主成分?jǐn)?shù)量的增多,分類效果逐漸變差,而Y-awa...
【文章來源】:哈爾濱工業(yè)大學(xué)黑龍江省 211工程院校 985工程院校
【文章頁數(shù)】:60 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
Cytoscape本地單機(jī)與Web端數(shù)據(jù)可視化示例
不同主成分?jǐn)?shù)下各算法分類準(zhǔn)確率
圖 3-3 不同特征數(shù)下 SPCR 與 Y-aware PCR 性能對(duì)比法原理可以發(fā)現(xiàn),SPCR 實(shí)際是對(duì)原始數(shù)據(jù) X 進(jìn)行了一與因變量 Y 弱相關(guān)的信息直接從 X 中去掉,這種做法難主成分?jǐn)?shù)排在 20 以后的特征)中可能包含有更深層次
【參考文獻(xiàn)】:
期刊論文
[1]一種改進(jìn)的主成分分析特征抽取算法:YJ-MICPCA[J]. 謝昆明,羅幼喜. 武漢科技大學(xué)學(xué)報(bào). 2019(03)
[2]改進(jìn)PCA-LDA的人臉識(shí)別算法研究[J]. 馬帥旗. 陜西理工大學(xué)學(xué)報(bào)(自然科學(xué)版). 2019(02)
[3]基于SM2和奇異值分解(SVD)的指紋水印身份認(rèn)證算法[J]. 郭蕾,劉福平,李詩珂,龐建萍. 北京印刷學(xué)院學(xué)報(bào). 2019(02)
[4]基因表達(dá)譜數(shù)據(jù)分類算法綜述[J]. 張奇,榮雯雯,劉艷. 實(shí)用預(yù)防醫(yī)學(xué). 2018(08)
[5]改進(jìn)的分段主成分分析算法及其在前列腺分割中的應(yīng)用[J]. 宋建萍,石勇濤. 現(xiàn)代電子技術(shù). 2018(13)
[6]高維數(shù)據(jù)降維技術(shù)及研究進(jìn)展[J]. 劉靖,趙逢禹. 電子科技. 2018(03)
[7]三種統(tǒng)計(jì)分析方法在基因表達(dá)譜數(shù)據(jù)中的比較研究[J]. 史曉雯,肖純,劉蕓良,劉艷. 實(shí)用預(yù)防醫(yī)學(xué). 2018(02)
[8]有監(jiān)督主成分回歸法在近紅外光譜定量分析中的應(yīng)用研究[J]. 劉旭華,徐興忠,何雄奎,張錄達(dá). 光譜學(xué)與光譜分析. 2009(11)
博士論文
[1]生物信息數(shù)據(jù)分析的若干問題研究[D]. 范業(yè)田.大連理工大學(xué) 2017
[2]基因表達(dá)譜的數(shù)據(jù)挖掘方法研究[D]. 陳濤.西北工業(yè)大學(xué) 2016
[3]高維數(shù)據(jù)降維可視化研究及其在生物醫(yī)學(xué)中的應(yīng)用[D]. 徐微微.武漢大學(xué) 2016
[4]核方法的研究及其應(yīng)用[D]. 牟少敏.北京交通大學(xué) 2008
碩士論文
[1]基于雙線性概率主成分分析的聚類算法研究[D]. 孫小軍.云南財(cái)經(jīng)大學(xué) 2018
[2]基于高通量基因數(shù)據(jù)的可視化在線診斷工具[D]. 孫策.哈爾濱工業(yè)大學(xué) 2018
[3]基于傳統(tǒng)特征提取和深度學(xué)習(xí)方法相結(jié)合的基因表達(dá)數(shù)據(jù)降維研究[D]. 郜園園.西安電子科技大學(xué) 2018
[4]基于Web的中藥作用機(jī)理的網(wǎng)絡(luò)可視化研究[D]. 楊明輝.蘭州大學(xué) 2018
[5]基于Web前端數(shù)據(jù)可視化研究與應(yīng)用[D]. 王水波.西安電子科技大學(xué) 2017
[6]基于神經(jīng)網(wǎng)絡(luò)的全基因組DNA甲基化預(yù)測(cè)研究[D]. 劉光輝.大連海事大學(xué) 2017
[7]DNA甲基化狀態(tài)在線預(yù)測(cè)平臺(tái)的設(shè)計(jì)與實(shí)現(xiàn)[D]. 李承哲.電子科技大學(xué) 2016
本文編號(hào):2898025
【文章來源】:哈爾濱工業(yè)大學(xué)黑龍江省 211工程院校 985工程院校
【文章頁數(shù)】:60 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
Cytoscape本地單機(jī)與Web端數(shù)據(jù)可視化示例
不同主成分?jǐn)?shù)下各算法分類準(zhǔn)確率
圖 3-3 不同特征數(shù)下 SPCR 與 Y-aware PCR 性能對(duì)比法原理可以發(fā)現(xiàn),SPCR 實(shí)際是對(duì)原始數(shù)據(jù) X 進(jìn)行了一與因變量 Y 弱相關(guān)的信息直接從 X 中去掉,這種做法難主成分?jǐn)?shù)排在 20 以后的特征)中可能包含有更深層次
【參考文獻(xiàn)】:
期刊論文
[1]一種改進(jìn)的主成分分析特征抽取算法:YJ-MICPCA[J]. 謝昆明,羅幼喜. 武漢科技大學(xué)學(xué)報(bào). 2019(03)
[2]改進(jìn)PCA-LDA的人臉識(shí)別算法研究[J]. 馬帥旗. 陜西理工大學(xué)學(xué)報(bào)(自然科學(xué)版). 2019(02)
[3]基于SM2和奇異值分解(SVD)的指紋水印身份認(rèn)證算法[J]. 郭蕾,劉福平,李詩珂,龐建萍. 北京印刷學(xué)院學(xué)報(bào). 2019(02)
[4]基因表達(dá)譜數(shù)據(jù)分類算法綜述[J]. 張奇,榮雯雯,劉艷. 實(shí)用預(yù)防醫(yī)學(xué). 2018(08)
[5]改進(jìn)的分段主成分分析算法及其在前列腺分割中的應(yīng)用[J]. 宋建萍,石勇濤. 現(xiàn)代電子技術(shù). 2018(13)
[6]高維數(shù)據(jù)降維技術(shù)及研究進(jìn)展[J]. 劉靖,趙逢禹. 電子科技. 2018(03)
[7]三種統(tǒng)計(jì)分析方法在基因表達(dá)譜數(shù)據(jù)中的比較研究[J]. 史曉雯,肖純,劉蕓良,劉艷. 實(shí)用預(yù)防醫(yī)學(xué). 2018(02)
[8]有監(jiān)督主成分回歸法在近紅外光譜定量分析中的應(yīng)用研究[J]. 劉旭華,徐興忠,何雄奎,張錄達(dá). 光譜學(xué)與光譜分析. 2009(11)
博士論文
[1]生物信息數(shù)據(jù)分析的若干問題研究[D]. 范業(yè)田.大連理工大學(xué) 2017
[2]基因表達(dá)譜的數(shù)據(jù)挖掘方法研究[D]. 陳濤.西北工業(yè)大學(xué) 2016
[3]高維數(shù)據(jù)降維可視化研究及其在生物醫(yī)學(xué)中的應(yīng)用[D]. 徐微微.武漢大學(xué) 2016
[4]核方法的研究及其應(yīng)用[D]. 牟少敏.北京交通大學(xué) 2008
碩士論文
[1]基于雙線性概率主成分分析的聚類算法研究[D]. 孫小軍.云南財(cái)經(jīng)大學(xué) 2018
[2]基于高通量基因數(shù)據(jù)的可視化在線診斷工具[D]. 孫策.哈爾濱工業(yè)大學(xué) 2018
[3]基于傳統(tǒng)特征提取和深度學(xué)習(xí)方法相結(jié)合的基因表達(dá)數(shù)據(jù)降維研究[D]. 郜園園.西安電子科技大學(xué) 2018
[4]基于Web的中藥作用機(jī)理的網(wǎng)絡(luò)可視化研究[D]. 楊明輝.蘭州大學(xué) 2018
[5]基于Web前端數(shù)據(jù)可視化研究與應(yīng)用[D]. 王水波.西安電子科技大學(xué) 2017
[6]基于神經(jīng)網(wǎng)絡(luò)的全基因組DNA甲基化預(yù)測(cè)研究[D]. 劉光輝.大連海事大學(xué) 2017
[7]DNA甲基化狀態(tài)在線預(yù)測(cè)平臺(tái)的設(shè)計(jì)與實(shí)現(xiàn)[D]. 李承哲.電子科技大學(xué) 2016
本文編號(hào):2898025
本文鏈接:http://www.wukwdryxk.cn/projectlw/swxlw/2898025.html
最近更新
教材專著