基于單細胞測序數(shù)據(jù)的細胞亞型發(fā)現(xiàn)研究
發(fā)布時間:2020-06-19 01:51
【摘要】:隨著單細胞測序技術的進步,已經(jīng)有越來越多單細胞層面的轉(zhuǎn)錄數(shù)據(jù)。借助這些單細胞數(shù)據(jù)我們可以深入了解細胞異質(zhì)性和細胞層面的潛在機制。但數(shù)據(jù)的復雜性給我們帶來眾多挑戰(zhàn)。對于細胞識別、聚類和功能發(fā)現(xiàn)可以通過特殊的轉(zhuǎn)錄信號在單分子層面得到很好的認識。最常用的方法是根據(jù)基因表達水平,判斷同屬于一類型的細胞,此類研究基于一個生物學假設即:基因表達水平?jīng)Q定其功能蛋白的合成,相似的基因表達水平有可能合成相似的功能蛋白。由此可見,對單細胞數(shù)據(jù)進行聚類具有十分重要的醫(yī)學意義。目前針對單細胞數(shù)據(jù)聚類問題,已經(jīng)提出了一些方法,比如pcaReduce生成層次模型、t-SNE非線性降維、考慮dropout影響的ZIFA模型、考慮稀有類型的Racel D模型、網(wǎng)絡聚類snn-clique模型等等。盡管上述論文已經(jīng)從不同方面解決聚類問題,但眾多論文都沒有對低豐度基因進行篩選。已有論文證實低豐度基因?qū)岣邤?shù)據(jù)的維度,而且對聚類結果有一定的影響。論文具體針對snn-clique模型中qqaasi-clique的篩選具有忽略網(wǎng)絡整體連接性的問題。clusterone模型中可以通過引入對內(nèi)部邊和外部邊綜合考量的內(nèi)聚力(cohesiveness),從而避免對整體和局部節(jié)點度考慮不平衡的研究。本篇論文根據(jù)上述兩者的優(yōu)缺點將snn鄰接圖和基于內(nèi)聚力引導的搜索聚類算法clusterone結合一起,提出snn-clusterone模型。他可以自動確定數(shù)據(jù)的聚類數(shù)量,此外利用rank的思想避免高維數(shù)據(jù)聚類的不適情況,并且在一定程度上避免snn-clique在網(wǎng)絡整體連接性的缺陷。通過模擬數(shù)據(jù)驗證snn-clusterone具有高魯棒性,在模擬數(shù)據(jù)的結果上的聚類結果此模型優(yōu)于snn-clique,在真實數(shù)據(jù)中,發(fā)現(xiàn)在基于多種距離情況下,snn-clusterone的結果在多種聚類評價指標下都高于snn-clique,說明此模型通過基因篩選和從整體連接性考慮,可以得到更好的聚類效果。
【學位授予單位】:華中師范大學
【學位級別】:碩士
【學位授予年份】:2018
【分類號】:C81
【圖文】:
1:預處理后的單細胞數(shù)據(jù)通過傳統(tǒng)的距離刻畫相似性矩陣,然后根據(jù)共享最近鄰算法(Wi斷節(jié)點之間是否存在連接權重,對存在權重的節(jié)點對計算權重大小,最終生成SNN連接圖。逡逑定義KNN邐計算數(shù)據(jù)集叉的相似矩陣(歐式距離或其他任何距離)并排本而到其他樣本的距離按照升序,令第個距離記為4^,則樣本而的前fc離用KiViVbi)表示并記作:逡逑KNN(xi)邋=邋{Xj邋e邋Xldixuxj)邋<邋dki},邐(2.定義edge(Xi,x/)計算x;和%的是否有邊,當且僅當在:^和%的中至少有一個共享的節(jié)點時,則而和之間有3邋edge(Xi,邋Xj、\KNN(Xi)邋D邋KNN(Xj)子邋0,邐(2.定義edge權重edge(;Ti,;Ej)的權重被定義為A:和if_/V7V中平均ranA:差值高值:逡逑edge(xi,邋Xj)邋—邋max{k邋—邋-(rank{v,Xi)邋+邋rank(v,Xj))),邐(2.
丨碩士學位論文逡逑MASTER’S邋THESIS逡逑兩個子圖的節(jié)點數(shù)和邊數(shù)都相同,r*邋=邋f,邋A:邋=邋8,但是觀察兩個子圖,左圖中逡逑guasi-digue可以很好的刻畫復雜網(wǎng)絡的緊密性可是對于右圖,^tasi-digue并不逡逑能很好的刻畫子圖的連接,在復雜網(wǎng)路中guasi-digue由于只考慮節(jié)點度數(shù)而忽逡逑略整體的連通性,所以并不能很好的刻畫子圖的密度結構,而duderone提出的逡逑內(nèi)聚力可以很好的提升這方面性能。逡逑
【學位授予單位】:華中師范大學
【學位級別】:碩士
【學位授予年份】:2018
【分類號】:C81
【圖文】:
1:預處理后的單細胞數(shù)據(jù)通過傳統(tǒng)的距離刻畫相似性矩陣,然后根據(jù)共享最近鄰算法(Wi斷節(jié)點之間是否存在連接權重,對存在權重的節(jié)點對計算權重大小,最終生成SNN連接圖。逡逑定義KNN邐計算數(shù)據(jù)集叉的相似矩陣(歐式距離或其他任何距離)并排本而到其他樣本的距離按照升序,令第個距離記為4^,則樣本而的前fc離用KiViVbi)表示并記作:逡逑KNN(xi)邋=邋{Xj邋e邋Xldixuxj)邋<邋dki},邐(2.定義edge(Xi,x/)計算x;和%的是否有邊,當且僅當在:^和%的中至少有一個共享的節(jié)點時,則而和之間有3邋edge(Xi,邋Xj、\KNN(Xi)邋D邋KNN(Xj)子邋0,邐(2.定義edge權重edge(;Ti,;Ej)的權重被定義為A:和if_/V7V中平均ranA:差值高值:逡逑edge(xi,邋Xj)邋—邋max{k邋—邋-(rank{v,Xi)邋+邋rank(v,Xj))),邐(2.
丨碩士學位論文逡逑MASTER’S邋THESIS逡逑兩個子圖的節(jié)點數(shù)和邊數(shù)都相同,r*邋=邋f,邋A:邋=邋8,但是觀察兩個子圖,左圖中逡逑guasi-digue可以很好的刻畫復雜網(wǎng)絡的緊密性可是對于右圖,^tasi-digue并不逡逑能很好的刻畫子圖的連接,在復雜網(wǎng)路中guasi-digue由于只考慮節(jié)點度數(shù)而忽逡逑略整體的連通性,所以并不能很好的刻畫子圖的密度結構,而duderone提出的逡逑內(nèi)聚力可以很好的提升這方面性能。逡逑
【相似文獻】
相關期刊論文 前10條
1 李法君;;降解組測序技術及其研究進展[J];生物學教學;2017年04期
2 彭桂蘭;陳嘉慧;榮丹箐;;第四代測序技術[J];農(nóng)村經(jīng)濟與科技;2017年10期
3 王海;;高通量測序技術新名詞的理解和辨析[J];中國科技術語;2017年04期
4 權冰娥;李樹;;新一代DNA測序技術在法醫(yī)實踐中的應用及其研究進展[J];遼寧警察學院學報;2017年06期
5 鄭秋燕;李清;毛華明;冷靜;;測序技術的發(fā)展對瘤胃元基因組研究的影響[J];黑龍江畜牧獸醫(yī);2015年21期
6 韓齊;李媛媛;孫方達;孔保華;陳倩;;新一代測序技術在食品微生物學中的應用[J];食品工業(yè);2016年01期
7 杜兵兵;;第二代高通量測序技術的原理及其在醫(yī)學中的應用進展[J];中國繼續(xù)醫(yī)學教育;2016年03期
8 周瑩;許冰瑩;;二代測序技術在臨床醫(yī)學上的相關應用[J];昆明醫(yī)科大學學報;2016年03期
9 烏日拉嘎;徐海燕;馮淑貞;孫志宏;孟和畢力格;張和平;;測序技術的研究進展及三代測序的應用[J];中國乳品工業(yè);2016年04期
10 郭海燕;程國虎;李擁軍;張昊;秦康樂;;高通量測序技術及其在生物學中的應用[J];當代畜牧;2016年12期
相關會議論文 前10條
1 趙潔;趙志軍;賈偉;師志云;趙穎;張玉英;趙s
本文編號:2720138
本文鏈接:http://www.wukwdryxk.cn/guanlilunwen/tongjijuecelunwen/2720138.html
最近更新
教材專著