近日,機械電子工程學院劉平教授、生命科學學院李祥教授聯合中國農業科學院果樹研究所王海波研究員在《Plant Biotechnology Journal》上發表了題為“DNAwhisper: An Integrated Deep Learning Pyramidal Framework for Multi-Trait Genomic Prediction and Adaptive Marker Prioritisation”的研究論文,提出了可解釋的深度學習全基因組選擇計算方法,助力作物復雜表型的早期預測和復雜數量性狀遺傳效應挖掘。機電學院博士后馬岳鑫為第一作者,劉平教授、李祥教授和王海波研究員為共同通訊作者。

圖1. DNAwhisper模型的金字塔結構示意圖
現有全基因組選擇(genomic selection,GS)方法多以加性模型為主,上位性等非加性效應的建模能力相對不足,對復雜數量性狀的遺傳貢獻刻畫不夠充分。深度模型雖然具備更強的非線性表達能力,但在多特征小樣本條件下訓練與泛化容易受限,難以支撐育種決策與生物學驗證。團隊創新性的提出一種金字塔式可解釋育種工具(DNAwhisper模型,圖1):該工具可將分子標記按遺傳分塊進行分層處理,借助模塊參數共享機制降低模型規模;融合關系保持預訓練,以自監督方式對齊樣本間遺傳距離,使模型在隱空間中保留群體親緣結構,從而在小樣本條件下獲得更穩健的歸納偏置。借助深度監督技術,將性狀相關的遺傳關聯信號逐層蒸餾,既強化預測所需的關鍵信息,也為后續機制解析提供可追溯的表征基礎以提升可解釋性。研究表明,DNAwhisper模型在多個農作物群體上相較基準模型預測精度提升3.0%至10.0%,并可通過注意力權重回溯識別赤霉素(GA)代謝通路等關鍵調控信號(圖2)。該方法為作物復雜表型的早期預測和數量性狀遺傳位點的深度挖掘提供了新的途徑,可用于輔助種質篩選從而加速育種進程。

圖2. DNAwhisper 模型的復雜性狀基因挖掘
研究工作得到了山東省重點研發計劃項目、國家重點研發計劃項目、山東省自然科學基金、山東省博士后基金和小麥育種全國重點實驗室811項目的資助。
論文鏈接:https://onlinelibrary.wiley.com/doi/10.1111/pbi.70619
編 輯:萬 千
審 核:賈 波








