基于大規(guī)模質(zhì)譜數(shù)據(jù)的蛋白質(zhì)水平質(zhì)量控制方法研究
本文選題:蛋白質(zhì)組學(xué) + 數(shù)據(jù)庫搜索 ; 參考:《華東師范大學(xué)》2017年碩士論文
【摘要】:人類基因密碼的破譯和圖譜繪制的完成,極大地鼓舞了科學(xué)家對(duì)生老病死的規(guī)律、生命起源與進(jìn)化的過程、生物個(gè)體間高矮胖瘦差異性的成因等謎題的研究熱情。以此為基礎(chǔ),為了更全面的理解和掌握生命現(xiàn)象的本質(zhì)和規(guī)律,作為生命活動(dòng)和生物過程的直接影響者,蛋白質(zhì)組學(xué)順理成章的進(jìn)入科學(xué)家們的視野,并在近幾年逐漸成為生命科學(xué)科研工作者的研究熱點(diǎn)和重點(diǎn)。而作為蛋白質(zhì)組學(xué)最關(guān)鍵的支撐技術(shù)的生物質(zhì)譜技術(shù)的飛躍式發(fā)展更是為蛋白質(zhì)組學(xué)提供了強(qiáng)有力的技術(shù)支持。大規(guī)模蛋白質(zhì)組學(xué)的研究也因此拉開帷幕。生物質(zhì)譜技術(shù)與數(shù)據(jù)庫搜索方法的聯(lián)合促成了高通量大規(guī)模的蛋白質(zhì)質(zhì)譜數(shù)據(jù)的累積。數(shù)據(jù)庫搜索策略雖然極大的提高了生物質(zhì)譜技術(shù)鑒定蛋白質(zhì)的效率,但是由于質(zhì)譜實(shí)驗(yàn)生物樣本的差異巨大、質(zhì)譜儀器的類別繁多且性能差異顯著、現(xiàn)有數(shù)據(jù)庫搜索算法的不足以及不同實(shí)驗(yàn)的操作過程不同等等因素造成了生物質(zhì)譜技術(shù)鑒定的蛋白質(zhì)質(zhì)量存在問題,我們的目的是在鑒定到盡可能多的蛋白質(zhì)的情況下保證鑒定結(jié)果的準(zhǔn)確性,也就是提高召回率的同時(shí)盡可能減少假陽性。因此生物質(zhì)譜技術(shù)鑒定蛋白質(zhì)的質(zhì)量控制方法研究成為一個(gè)關(guān)鍵問題。本文研究的重點(diǎn)在于不同來源的大規(guī)模蛋白質(zhì)質(zhì)譜數(shù)據(jù)鑒定蛋白質(zhì)的質(zhì)量控制方法的研究。解決多個(gè)不同來源實(shí)驗(yàn)數(shù)據(jù)進(jìn)行蛋白質(zhì)質(zhì)譜鑒定的情況下假陽性蛋白質(zhì)過多鑒定的問題。使用來自proteomexchange數(shù)據(jù)庫的四組不同儀器產(chǎn)生的釀酒酵母的蛋白質(zhì)質(zhì)譜實(shí)驗(yàn)數(shù)據(jù),總共113個(gè)RAW文件,進(jìn)行引入實(shí)驗(yàn)間權(quán)重作為特征的質(zhì)量控制方法鑒定蛋白質(zhì),再分別與傳統(tǒng)的過濾譜圖的質(zhì)控方法和根據(jù)蛋白打分過濾蛋白的質(zhì)控方法鑒定蛋白質(zhì)做比較。結(jié)果顯示,蛋白質(zhì)打分的方法明顯優(yōu)于傳統(tǒng)方法,而本文引入新特征的方法進(jìn)一步改善了蛋白質(zhì)鑒定的質(zhì)量控制結(jié)果。
[Abstract]:The decoding of human gene code and the completion of mapping greatly encourage scientists to study the rules of birth, old age and death, the origin and evolution of life, the causes of the difference between individuals, and so on. On this basis, in order to fully understand and understand the nature and laws of life phenomena, proteomics, as a direct influence of life activities and biological processes, naturally enters the field of vision of scientists. In recent years, it has gradually become the research hotspot and focus of life science researchers. The rapid development of mass spectrometry, which is the key technology of proteomics, provides powerful technical support for proteomics. The study of large-scale proteomics has thus begun. The combination of biological mass spectrometry and database search techniques has contributed to the accumulation of high throughput and large-scale protein mass spectrometry data. Although the database search strategy has greatly improved the efficiency of biological mass spectrometry in protein identification, but because of the huge differences in biological samples in mass spectrometry experiments, mass spectrometry instruments have a wide variety of types and significant differences in performance. The deficiencies of existing database search algorithms and the different operating processes of different experiments have caused the problems of protein quality identified by bio-mass spectrometry. Our aim is to ensure accuracy in identifying as many proteins as possible, that is, to increase recall rates while minimizing false positives. Therefore, the study of quality control method for protein identification by mass spectrometry becomes a key issue. The focus of this study is on the quality control methods for protein identification by mass spectrometry data from different sources. To solve the problem of false positive protein identification under the condition of multiple experimental data from different sources. The protein mass spectrometry data of Saccharomyces cerevisiae produced by four different instruments from proteomexchange database were used to identify proteins by using a quality control method which introduced the weight of the experiment to identify the protein, which consisted of 113 RAW files. Then compared with the traditional quality control method of filtration spectrum and the quality control method based on protein scoring filter protein. The results showed that the protein scoring method was superior to the traditional method, and the new feature method was introduced in this paper to further improve the quality control results of protein identification.
【學(xué)位授予單位】:華東師范大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2017
【分類號(hào)】:Q51
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 呂茂民,章金剛;生物質(zhì)譜技術(shù)及其應(yīng)用[J];生物技術(shù)通報(bào);2001年04期
2 方均建;董方霆;張學(xué)敏;孫建中;;生物質(zhì)譜技術(shù)在生物毒素檢測中的應(yīng)用進(jìn)展[J];軍事醫(yī)學(xué)科學(xué)院院刊;2007年06期
3 楊瑩瑩;鄭萍;葉利明;;生物質(zhì)譜技術(shù)及其在核酸領(lǐng)域的應(yīng)用[J];藥物分析雜志;2008年04期
4 張巖;神奇的生物質(zhì)譜技術(shù)[J];國外科技動(dòng)態(tài);2005年01期
5 鄒麗敏;李博;劉文英;;生物質(zhì)譜技術(shù)的發(fā)展及在蛋白質(zhì)結(jié)構(gòu)研究中的應(yīng)用[J];藥學(xué)進(jìn)展;2008年02期
6 王曉娜;許麗娜;彭金詠;劉克辛;;現(xiàn)代生物質(zhì)譜技術(shù)在生物大分子分析研究中的應(yīng)用[J];中國現(xiàn)代應(yīng)用藥學(xué);2008年02期
7 崔麗娟;黃瑾;;生物質(zhì)譜技術(shù)在蛋白質(zhì)結(jié)構(gòu)鑒定中的研究進(jìn)展[J];農(nóng)墾醫(yī)學(xué);2009年04期
8 鄭永紅,楊松成;生物質(zhì)譜技術(shù)在蛋白質(zhì)結(jié)構(gòu)鑒定中的應(yīng)用進(jìn)展[J];中國生化藥物雜志;2003年06期
9 李維平,李云;生物質(zhì)譜技術(shù)與蛋白質(zhì)組學(xué)[J];生命科學(xué)研究;2004年S2期
10 趙麗艷;周春喜;張養(yǎng)軍;蔡耘;錢小紅;;基于生物質(zhì)譜技術(shù)的磺酸化修飾策略及其在蛋白質(zhì)組學(xué)中的應(yīng)用[J];質(zhì)譜學(xué)報(bào);2007年03期
相關(guān)會(huì)議論文 前4條
1 譚生建;劉剛;姜韌;張華;;生物質(zhì)譜技術(shù)研究進(jìn)展及其應(yīng)用[A];2007年全國生化與生物技術(shù)藥物學(xué)術(shù)年會(huì)論文集[C];2007年
2 劉麟;;應(yīng)用新型生物質(zhì)譜技術(shù)快速定量多肽毒素并解析分子結(jié)構(gòu)[A];第九屆中國生物毒素學(xué)術(shù)研討會(huì)論文摘要[C];2009年
3 魏廣智;姜穎;賀福初;;用生物質(zhì)譜技術(shù)研究肝刺激物(HSS)中促進(jìn)細(xì)胞增殖的活性成分[A];中國蛋白質(zhì)組學(xué)第三屆學(xué)術(shù)大會(huì)論文摘要[C];2005年
4 劉小琳;佟玲;郭欣;張瀛;周水平;朱永宏;;生物質(zhì)譜技術(shù)在蛋白藥物研究中的應(yīng)用[A];2012年中國藥學(xué)大會(huì)暨第十二屆中國藥師周論文集[C];2012年
相關(guān)碩士學(xué)位論文 前2條
1 陳雙冠;基于大規(guī)模質(zhì)譜數(shù)據(jù)的蛋白質(zhì)水平質(zhì)量控制方法研究[D];華東師范大學(xué);2017年
2 龍承祖;生物質(zhì)譜技術(shù)在真菌源激活蛋白研究中的應(yīng)用[D];中國農(nóng)業(yè)科學(xué)院;2006年
,本文編號(hào):1784769
本文鏈接:http://www.wukwdryxk.cn/shoufeilunwen/benkebiyelunwen/1784769.html