蛋白質組學最新進展、應用及挑戰
發布時(shí)間(jiān):
2021-09-15
蛋白質組學是當前生(shēng)物制(zhì)藥發展非常迅速的熱門(mén)領域之一,研究蛋白質組學不但(dàn)能夠加深對支持跨細胞、組織和(hé)整個(gè)生(shēng)物體(tǐ)的生(shēng)物狀态分子過程的理(lǐ)解,還(hái)能夠幫助包括人(rén)類、動物和(hé)植物生(shēng)物學、個(gè)性化醫(yī)學和(hé)法醫(yī)學在內(nèi)的各個(gè)科學研究領域快速發展。這些(xiē)研發收益在很(hěn)大(dà)程度上(shàng)都要歸功于蛋白質組學技(jì)術(shù)、數(shù)據處理(lǐ)能力和(hé)數(shù)據共享的進步。在本文中,我們将與世界各地的蛋白質組學權威專家(jiā)一起,共同探討(tǎo)蛋白質組學的最新進展及其更廣泛的潛在影(yǐng)響
蛋白質組學是當前生(shēng)物制(zhì)藥發展非常迅速的熱門(mén)領域之一,研究蛋白質組學不但(dàn)能夠加深對支持跨細胞、組織和(hé)整個(gè)生(shēng)物體(tǐ)的生(shēng)物狀态分子過程的理(lǐ)解,還(hái)能夠幫助包括人(rén)類、動物和(hé)植物生(shēng)物學、個(gè)性化醫(yī)學和(hé)法醫(yī)學在內(nèi)的各個(gè)科學研究領域快速發展。這些(xiē)研發收益在很(hěn)大(dà)程度上(shàng)都要歸功于蛋白質組學技(jì)術(shù)、數(shù)據處理(lǐ)能力和(hé)數(shù)據共享的進步。在本文中,我們将與世界各地的蛋白質組學權威專家(jiā)一起,共同探討(tǎo)蛋白質組學的最新進展及其更廣泛的潛在影(yǐng)響。
一、蛋白質組學關鍵技(jì)術(shù)發展
1、質譜蛋白質組學
蛋白質組學研究采用的分析技(jì)術(shù)大(dà)緻分為(wèi)低(dī)通(tōng)量和(hé)高(gāo)通(tōng)量兩類。幾十年來(lái),質譜(MS)一直是在高(gāo)通(tōng)量分析中最廣泛使用的“金标準”。從曆史上(shàng)看,基于質譜的蛋白質組學面臨的一項關鍵問題就是敏感性和(hé)特異性,不過近年來(lái),質譜技(jì)術(shù)的格局發生(shēng)了翻天覆地的變化。供應商推出了具有(yǒu)高(gāo)速度、靈敏度和(hé)特異性功能的質譜儀器(qì),科學家(jiā)們現在也可(kě)以憑借這些(xiē)新型儀器(qì)更加深入研究蛋白質組學。
諾和(hé)諾德基金會(huì)蛋白質研究中心蛋白質組學項目的研究主任和(hé)組長Matthias Mann教授在被問及質譜蛋白質組學的突破時(shí),特别強調了Aebersold實驗室率在數(shù)據獨立采集(DIA)方面的進展。與其姊妹技(jì)術(shù)數(shù)據相關分析(DDA)不同的是,DIA在第二個(gè)循環(MS2)中将串聯MS(MS1)第一個(gè)循環中産生(shēng)的所有(yǒu)前體(tǐ)離子分解,這也為(wèi)研究人(rén)員提供了更好的無偏分析能力、更大(dà)的蛋白質組覆蓋率和(hé)更高(gāo)的再現性。近年來(lái),在蛋白質組學研究,特别是在腫瘤學領域,使用基于DIA質譜的頻率也一直在持續增長。此外,DIA技(jì)術(shù)還(hái)在神經科學蛋白質組學領域取得(de)了積極進展,包括發現了阿爾茨海默病的相關信息。
2、基于适體(tǐ)的蛋白質組學
雖然質譜技(jì)術(shù)多(duō)年來(lái)一直在蛋白質組學研究領域占據主導地位,但(dàn)最近出現的“第二代”蛋白質組學平台則是利用基于适體(tǐ)開(kāi)發的新型技(jì)術(shù)。約翰霍普金斯大(dà)學醫(yī)學院研究員Benjamin Orsburn博士也表示,盡管LC-MS在蛋白質組學領域已經壟斷了幾十年,但(dàn)現在的情況顯然已不再如此。
适體(tǐ)是一種短(duǎn)的單鏈(ss)DNA分子,能夠進行(xíng)獨特的匹配确認,選擇性地與生(shēng)物靶标結合。在生(shēng)物标志(zhì)物發現等領域,該技(jì)術(shù)具有(yǒu)特異性和(hé)選擇性等優勢,因此要優于受到動态範圍限制(zhì)的MS蛋白質組學。此前,研究人(rén)員基于适體(tǐ)的蛋白質組學對來(lái)自Framingham心髒研究中的1895名女性進行(xíng)了研究,以便确定心髒重塑和(hé)心力衰竭事件的生(shēng)物标志(zhì)物。試驗結果顯示,17種蛋白質被發現與超聲心動圖特征相關,6種蛋白質與心力衰竭事件相關,利用遺傳變異數(shù)據的進一步分析也進一步支持了這些(xiē)發現。
Orsburn表示,與LC-MS技(jì)術(shù)相比,适體(tǐ)技(jì)術(shù)的使用将更少(shǎo)受到細胞中絕對蛋白質拷貝數(shù)的影(yǐng)響。然而,在能夠識别更高(gāo)百分比的蛋白質組之前,質譜蛋白質組學目前可(kě)能仍然将會(huì)是首選方法,而基于适體(tǐ)的技(jì)術(shù)通(tōng)常會(huì)做(zuò)為(wèi)補充和(hé)輔助方法。最近,有(yǒu)研究人(rén)員提出的理(lǐ)想蛋白質測序平台,采用了條形碼DNA适體(tǐ)來(lái)識别肽的末端氨基酸,連接到下一代測序芯片可(kě)能會(huì)成為(wèi)折衷方案。Orsburn對此稱該領域的全部研發潛力仍需要一定的時(shí)間(jiān)才能實現。
二、人(rén)工智能和(hé)蛋白質組學
1、人(rén)工智能和(hé)藥物發現蛋白質組學
人(rén)工智能(AI)在蛋白質組學中的應用已經深刻改變了藥物發現領域的研發工作(zuò)。對研發人(rén)員來(lái)說,深入了解特定蛋白質如何以及為(wèi)何能夠相互作(zuò)用,對于推進細胞生(shēng)物學、開(kāi)發新藥和(hé)确定藥物引發治療和(hé)副作(zuò)用的機制(zhì)至關重要,然而這絕非易事。美國麻省理(lǐ)工學院計(jì)算(suàn)機科學與人(rén)工智能實驗室(CSAIL)博士後研究員Octavian-Eugen Ganea表示,為(wèi)了掌握互相作(zuò)用的蛋白質如何相互連接,必須通(tōng)過人(rén)工或計(jì)算(suàn)機手段嘗試所有(yǒu)可(kě)能的連接組合,以便找到最合理(lǐ)的連接組合,而如果不借助人(rén)工智能單純使用人(rén)工進行(xíng),将會(huì)是一個(gè)非常耗時(shí)的過程。
目前已有(yǒu)多(duō)種商業化的蛋白質對接方法可(kě)供選擇,但(dàn)它們都依賴于候選采樣、模闆和(hé)預計(jì)算(suàn)網格的特定任務特征,而這些(xiē)因素都會(huì)增加額外的計(jì)算(suàn)時(shí)間(jiān)。麻省理(lǐ)工學院Ganea團隊最近發表了一種新的深度學習模型EquiDock,采用了兩種蛋白質的3D結構,并能直接識别哪些(xiē)區(qū)域可(kě)能會(huì)發生(shēng)相互作(zuò)用。EquiDock模型能夠從約41000個(gè)蛋白質結構中捕獲複雜的對接模式,使用了具有(yǒu)數(shù)千個(gè)參數(shù)的幾何約束模型,這些(xiē)參數(shù)能夠動态地在計(jì)算(suàn)過程中自動調整。
訓練完成後,EquiDock模型将與其他四個(gè)現有(yǒu)的對接軟件進行(xíng)交叉比較,并且能夠在一到五秒(miǎo)內(nèi)預測最終的蛋白質複合物,速度比現有(yǒu)軟件快80至500倍。Ganea表示,藥物副作(zuò)用的快速計(jì)算(suàn)掃描是非常必要的,能夠顯著減少(shǎo)搜索範圍,否則即便整合了全球的人(rén)工試驗資源,也無法取得(de)滿意的結果。他強調稱,将EquiDock模型與其他蛋白質結構預測模型相結合,将有(yǒu)望進一步幫助其在藥物設計(jì)、蛋白質工程、抗體(tǐ)生(shēng)成和(hé)作(zuò)用機制(zhì)研究等方面的應用。
2、人(rén)工智能和(hé)質譜蛋白質組學
基于人(rén)工智能的方法還(hái)将幫助研究人(rén)員從獲得(de)的數(shù)據中獲得(de)更多(duō)的研發見解。質譜實驗需要數(shù)據庫搜索或光譜庫匹配來(lái)識别特定的蛋白質。整個(gè)過程不但(dàn)特别耗費時(shí)間(jiān),而且某些(xiē)蛋白質還(hái)可(kě)能會(huì)被錯誤識别或遺漏,對于依賴于通(tōng)過DDA分析生(shēng)成光譜庫的DIA質譜技(jì)術(shù)來(lái)說,這些(xiē)弊端似乎更加難以避免。為(wèi)此,研發人(rén)員現在已經建立了多(duō)種能夠預測光譜和(hé)肽特性的深度學習方法,包括但(dàn)不限于Prosit、DeepMass和(hé)DeepDIA,預計(jì)此舉能夠優化DIA方法的預測光譜庫,使蛋白質組學領域朝着更好的方向發展。
3、人(rén)工智能和(hé)非質譜蛋白質組學
人(rén)工智能還(hái)能夠輔助非質譜蛋白質組學的發展,這一領域對于理(lǐ)解以纏結、聚集的蛋白質為(wèi)特征的病理(lǐ)學(如阿爾茨海默病)是不可(kě)或缺的。該領域采用的關鍵方法包括顯微鏡和(hé)Frster共振能量轉移(FRET),研發過程需要大(dà)量時(shí)間(jiān)和(hé)足夠的專業知識對大(dà)型數(shù)據集進行(xíng)分析解釋。為(wèi)了克服這一數(shù)據難題,由Nikos Hatzakis教授領導的諾和(hé)諾德基金會(huì)蛋白質研究中心的研究人(rén)員最近創建了DeepFRET模型。
DeepFRET是一種人(rén)工智能的機器(qì)學習算(suàn)法,可(kě)以自動識别蛋白質運動模式,在幾秒(miǎo)鍾內(nèi)對數(shù)據集進行(xíng)分類(如果完全人(rén)工進行(xíng)則通(tōng)常需要幾天的時(shí)間(jiān))。蛋白質組學中人(rén)工智能的未來(lái)發展還(hái)要求人(rén)工智能平台必須遵守相關的标準、數(shù)據報告和(hé)共享方面實現跨組的同步。最近發布的關于在蛋白質組學和(hé)代謝組學中進行(xíng)和(hé)報告機器(qì)學習的數(shù)據、優化、模型、評估(DOME)建議,可(kě)能将有(yǒu)助于重塑該領域未來(lái)的發展方向。
三、法醫(yī)學和(hé)蛋白質組學
蛋白質組學更廣泛的應用也受益于前面討(tǎo)論的技(jì)術(shù)進步,例如在20世紀後期的“DNA革命”極大(dà)地促進了法醫(yī)學的發展,而現在的蛋白質組學似乎有(yǒu)望産生(shēng)類似的影(yǐng)響。對此,基于蛋白質的人(rén)類鑒定技(jì)術(shù)發明(míng)者、加州大(dà)學博士Glendon Parker表示,總的來(lái)說,蛋白質組學目前對法醫(yī)學的影(yǐng)響是有(yǒu)限的,這歸因于技(jì)術(shù)、法律、财務和(hé)文化因素,然而在刑事調查和(hé)起訴中采用和(hé)納入新方法将會(huì)成為(wèi)根本性的驅動力。
Parker補充說,蛋白質組學具有(yǒu)其獨特的內(nèi)在優勢,比如蛋白質比DNA更穩定,并且能夠像DNA一樣可(kě)以包含特定的身份識别信息。在DNA核酸被降解的情況下,可(kě)以使用蛋白質組學用于識别體(tǐ)液、性别、種族,并使用肌肉、骨骼和(hé)分解液樣本估計(jì)大(dà)緻的死亡時(shí)間(jiān)。Parker強調稱,雖然在法醫(yī)學中真正實施蛋白質組學一直以來(lái)都存在一定的挑戰,但(dàn)在未來(lái)蛋白質組學有(yǒu)可(kě)能顯著改變法醫(yī)證據的處理(lǐ)和(hé)分析方式。在短(duǎn)期內(nèi),該領域能夠輔助DNA技(jì)術(shù)用于DNA難以提供明(míng)确證據的法醫(yī)領域。
四、蛋白質組學的挑戰和(hé)未來(lái)展望
1、亟待開(kāi)放共享、加強全球合作(zuò)
目前,蛋白質組學領域面臨的最大(dà)限制(zhì)是技(jì)術(shù)的複雜性,需要研發人(rén)員在蛋白質組學冗長的工作(zuò)流程中熟練地操作(zuò)複雜技(jì)術(shù)和(hé)專業軟件。雖然蛋白質組學在靈敏度和(hé)速度方面已經取得(de)了飛速進步,研究成果也取得(de)了相應的進展,但(dàn)在背後都付出了巨大(dà)的代價。
Johnston表示,嚴格執行(xíng)、深度覆蓋的質譜實驗,特别是那(nà)些(xiē)針對複雜的生(shēng)物樣品上(shàng)的試驗研究,需要大(dà)量的質譜分析時(shí)間(jiān),因此研發人(rén)員必須要在研發成本、覆蓋範圍和(hé)樣本數(shù)量之間(jiān)不斷進行(xíng)利弊權衡。這也是當前限制(zhì)蛋白質組學更廣泛應用的難題之一,Parker也強調稱這些(xiē)困境限制(zhì)了技(jì)術(shù)創新,導緻大(dà)量具有(yǒu)發展前途的新興技(jì)術(shù)(包括蛋白質組學),最終沒有(yǒu)得(de)到充分利用。
在過去的十年裏,蛋白質組學領域中倡導開(kāi)放、共享、合作(zuò)的呼聲越來(lái)越高(gāo)。目前已經出現了增加可(kě)訪問性和(hé)可(kě)持續性的具體(tǐ)舉措,比如歐洲蛋白質組學基礎設施聯盟(EPIC-XS)就聯合了一些(xiē)歐洲領先的實驗室和(hé)科學家(jiā),倡議将各種技(jì)術(shù)、專業知識和(hé)試驗數(shù)據進行(xíng)彙集共享。共享的資源也不僅限于基于質譜的蛋白質組學,KTH訪問站(zhàn)點的細胞分析設施還(hái)開(kāi)放了基于抗體(tǐ)的成像方面的專業知識。
2、推進臨床應用困難重重
在蛋白質組學正式被确定為(wèi)臨床支柱之前仍有(yǒu)多(duō)項關鍵性挑戰需要克服,而這些(xiē)挑戰具體(tǐ)取決于臨床蛋白質組學中的特定應用。Mann表示,如果要在臨床中大(dà)規模使用,基于質譜的蛋白質組學需要變得(de)更加強大(dà)和(hé)易于使用,盡管許多(duō)研發團隊已經試圖通(tōng)過轉向高(gāo)流量色譜系統來(lái)實現這一目标,但(dàn)目前的成果并不理(lǐ)想,因為(wèi)此舉會(huì)導緻靈敏度受到影(yǐng)響。
目前,雖然分析技(jì)術(shù)一定程度上(shàng)提高(gāo)了深入挖掘蛋白質組的能力,但(dàn)産生(shēng)的數(shù)據量也在同步增長,這也為(wèi)蛋白質組學的臨床應用帶來(lái)了額外的瓶頸,包括如何對大(dà)量數(shù)據進行(xíng)處理(lǐ),以及如何在大(dà)規模數(shù)據集的基礎上(shàng)制(zhì)定生(shēng)物學和(hé)臨床假設。此外,為(wèi)了全面了解人(rén)類健康和(hé)疾病,蛋白質組學數(shù)據通(tōng)常必須與其他組學對應物相結合使用,如代謝組學、基因組學和(hé)轉錄組學。
除此之外,倫理(lǐ)方面的問題也被視(shì)為(wèi)蛋白質組學進軍臨床的挑戰之一。蛋白質組學分析可(kě)以提供原始診斷之外的信息,臨床醫(yī)生(shēng)将如何處理(lǐ)這些(xiē)數(shù)據仍存在監管空(kōng)白。雖然可(kě)以從此前的臨床基因組學的臨床實施中吸取一定教訓,但(dàn)蛋白質組學領域是一個(gè)完全不同的情況,因此在制(zhì)定監管框架和(hé)指南時(shí)很(hěn)難直接套用此前的标準。
不過,盡管目前存在多(duō)種局限性,但(dàn)權威專家(jiā)對該領域的未來(lái)充滿信心,Mann指出,質譜檢測技(jì)術(shù)将憑借其固有(yǒu)的特異性在臨床應用中持續發展。
相關新聞