近日,信息科學與工程學院講師徐敬可在《IEEE TRANSACTIONS ON COMMUNICATIONS》在線發表了題為“Folded Polynomial Codes for Coded Distributed AA^T-Type Matrix Multiplication”的研究論文。徐敬可老師為該論文的第一作者。
得益于分布式計算平臺和分布式計算框架的優良性能,以大規模矩陣乘積為核心的機器學習算法和大數據分析技術得到了快速發展。然而,由于網絡延遲、資源共享、系統維護和功率限制等因素,分布式計算系統的工作節點會出現暫時失效等未能完成計算任務的問題,我們稱之為稱為節點掉隊問題。
為了緩解節點掉隊的影響,針對矩陣與其轉置矩陣乘法,本研究利用折疊多項式設計了一類的新穎高效的分布式編碼算法。本文的關鍵技術是利用對稱性,將解碼問題轉化為折疊多項式的重構問題,進而利用無向圖的連通性確定了折疊多項式碼的恢復閾值。與現有算法相比,在保持原有節點計算復雜度的前提下,折疊多項式碼可以忍受更多的掉隊節點,有更小的通信代價、更低的譯碼復雜度等優勢。在相同掉隊節點的情形下,由于具有抵抗更多掉隊節點的優良性能,折疊多項式碼可以應用于更經濟的分布式計算平臺。因此,該研究具有更廣泛的應用價值。
該研究得到了國家自然基金項目、國家重點研發計劃項目、山東省自然科學基金項目、山東省“青創團隊計劃”項目、廣東省基礎與應用基礎研究基金項目的資助。
原文鏈接:DOI: 10.1109/TCOMM.2023.3286420
編 輯:萬 千
審 核:賈 波