基于序列信息對(duì)人類(lèi)DNaseⅠ超敏位點(diǎn)進(jìn)行預(yù)測(cè)
【文章頁(yè)數(shù)】:52 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖2-1k-mer算法獲取序列示意圖
第二章數(shù)據(jù)集與特征7圖2-1k-mer算法獲取序列示意圖2.2.2理化性質(zhì)相關(guān)性k-mer僅僅只考慮了短程相關(guān)信息,因此,我們加入了理化性質(zhì)的相關(guān)性,以代表寡核苷酸之間的遠(yuǎn)程相互作用,其表達(dá)式如下:Dphysicochemical=Λ(5)其中u可以用如下等式表示:ΛΛΛΛΛ(6....
圖4-1每個(gè)k值構(gòu)建的模型基于SVM的最終準(zhǔn)確率結(jié)果
電子科技大學(xué)碩士學(xué)位論文20第四章結(jié)果分析與討論DNaseI超敏位點(diǎn)的識(shí)別是鑒定脊椎動(dòng)物的順式調(diào)控序列的標(biāo)準(zhǔn)方法,它促進(jìn)了發(fā)現(xiàn)位于核心啟動(dòng)子之外的絕大多數(shù)已驗(yàn)證的人類(lèi)順式調(diào)控元件。盡管最近已發(fā)表了好幾個(gè)用于DNaseI超敏位點(diǎn)序列大規(guī)模定位的新型分子方法,但人類(lèi)DNaseI超敏位....
圖4-26種二核苷酸理化性質(zhì)的不同λ值在基于SVM的模型中的最終準(zhǔn)確率
第四章結(jié)果分析與討論21從結(jié)果中可以看到k值取2和5時(shí)模型的訓(xùn)練結(jié)果都表現(xiàn)出了不錯(cuò)的表現(xiàn)。通常,對(duì)于二型PseKNC公式中的一個(gè)特征向量,只會(huì)選擇一個(gè)k值來(lái)訓(xùn)練模型,而在其他k值特征向量中可能會(huì)丟失一些重要的特征信息。因此,我們選用范圍為2到5的四個(gè)k值作為特征集,以發(fā)現(xiàn)更多有效....
圖4-4k=2,g=2時(shí)根據(jù)mRMR特征篩選得到的結(jié)果,取前108個(gè)特征的結(jié)果
電子科技大學(xué)碩士學(xué)位論文24圖4-3二核苷酸和三核苷酸的G-gap特征提取算法的最終準(zhǔn)確率結(jié)果從圖4-3的結(jié)果中可以看出三核苷酸在整體水平上明顯表現(xiàn)得不如二核苷酸,并且由于基準(zhǔn)數(shù)據(jù)集中序列長(zhǎng)度比較偏短,將更高維度的核苷酸聯(lián)體作為特征向量的意義不大,因此我們不再嘗試四核苷酸及以上更....
本文編號(hào):3991485
本文鏈接:http://www.wukwdryxk.cn/shoufeilunwen/benkebiyelunwen/3991485.html