返回     科普工作
 
科普知識
機器學習發現自閉癥中“非編碼突變”的秘密

 

一項最新研究表明,在自閉癥當中,基因之間發生的自發突變擁有與固有基因相等的重要作用。

這項研究被發表在5月27日的《自然——遺傳學》當中,這也是全球第一項研究這些“非編碼”突變對自閉癥患者全基因組影響的研究。

過去三年當中,眾多團隊都在對自閉癥患者DNA的基因內部以及不同基因之間關系進行測序。然而,對基因之間數十萬種突變進行分類則幾乎是一項不可能完成的任務,特別是考慮到研究人員對這些基因片段本身就知之甚少。

此次新研究通過利用機器學習方法克服了這一挑戰。研究人員創建了一種算法,能夠預測特定的非編碼突變是否會產生某種基因表達。其根據每次突變的可能性為每個突變分配一個評分,用以表示其有害性程度。

論文聯合作者、新澤西州普林斯頓大學綜合基因組學教授Olga Troyanskaya表示,“其中采取的獨特方法在于,我們不僅僅是在計算突變,同時也利用基于深度學習的框架研究突變的影響。事實證明,基因突變也有重要與不重要之分,而且引發的效果也不盡相同。”

專家們表示,這項研究的優勢在于其能夠觀察整個基因組中的自發性突變。

并未參與此項研究的芝加哥大學遺傳學助理教授Xin He表示,此前對非編碼突變的分析工作主要集中在特定區域,且通常是那些與基因最好為接近的區域。

他指出,“在本次研究中,面向的則是全基因組,我們可以看到一個明確的區別性信號。這也代表著一種令人印象深刻的結果。”

約束性條件:

Troyanskaya的團隊和她的同事們分析了來自1790個家庭的7097個全基因組,這些家庭都有一個孩子患有自閉癥,但同時父母以及至少一個兄弟姐妹則未罹患自閉癥。他們在自閉癥兒童當中發現了成千上萬種自發性突變,但這些突變基本也出現在了未患自閉癥的兄弟姐妹當中。他們創建的算法預測了突變破壞控制基因表達的基因組區域的可能性。

在此之后,該研究小組搜索了人類基因突變數據庫,檢查是否存在任何與醫學狀況有關的突變,或者其是否同樣出現在對照組當中。他們匯總全部相關信息,以便為每一種突變生成影響評分。

研究人員發現,自閉癥兒童的非編碼突變平均影響評分確實高于未患疾病的兄弟姐妹。

總體而言,此項分析表明,這種突變導致4.3%的患兒罹患自閉癥;相比之下,基因之內的有害突變則占比5.4%。

該小組還評估了突變對于信使RNA(mRNA)的影響。集合RNA屬于基因與蛋白質之間的中介。他們發現,在自閉癥兒童當中,破壞mRNA的突變比影響DNA的突變具有更大的實際影響。

并未參與此項研究的華盛頓州立大學斯波坎生物醫學院醫學科學助理教授Lucia Peixoto表示,“這是一項值得跟進的有趣事實。我認為很多研究人員并未把RNA處理視為自閉癥的一大重要因素。”

研究人員發現,最接近自閉癥兒童高影響非編碼突變的基因往往具有直接影響腦組織的表達。

并未參與此項研究的英國牛津生物科學企業Genomics公司首席科學官Jeffrey Barrett表示,“很高興看到有諸多證據支持這一觀點,即通過影響正在發育的大腦當中的非編碼調控元素,確實有望解決自閉癥以及其它神經發育障礙類疾病。”

鄰近基因也傾向于參與自閉癥中的病變過程,例如神經元信號傳導或基因調控。這一途徑與編碼基因突變造成的破壞完全相同。

該小組還評估了高影響突變對培養細胞中基因表達的影響。他們發現,在大多數情況下,突變似乎都改變了基因的實際表達。

這一名為DeepSEA的算法目前已可在線獲取。Troyanskaya及其同事正在將他們發現的方法應用于患有其他疾病的個體全基因組研究,包括先天性心臟病。

來源:科技行者