近日,信息科學與工程學院張亮教授農業智能學習與計算團隊在《Neural Networks》發表了題為“Explicit Semantic Guided Bi-Incomplete Multi-modal Hashing with Label Co-occurrence and Label Graph Constraints”的研究論文。該研究針對多模態數據中普遍存在的不完整問題,提出了一種顯式語義引導的雙不完全多模態哈希新框架,為大規模多模態檢索提供了高效、穩健的解決方案。
隨著互聯網和人工智能的快速發展,海量的圖像、文本等多模態數據不斷涌現。這些數據從不同角度描述同一對象,蘊含豐富的互補信息。如何高效地融合和檢索多模態數據,成為多媒體計算與人工智能領域的重要研究方向。然而,實際場景中由于數據損壞、缺少標注或用戶輸入不全導致模態缺失問題。同時,多標簽數據中常見的部分標簽缺失也進一步影響了檢索性能。
針對上述挑戰,研究團隊提出了LaDiff-BIMH(Label-guided Diffusion Bi-Incomplete Multi-modal Hashing)框架。這是一種新的顯式語義引導的雙不完全多模態哈??蚣埽⒁霕撕灩铂F性約束與標簽圖結構約束,有效提升了生成哈希碼的判別性。大量實驗表明,LaDiff-BIMH優于最先進的多模態哈希方法,特別是在較高的缺失率情況下。

圖1: LaDiff-BIMH框架結構
論文以山東農業大學為第一單位發表。山東農業大學張亮教授和蘆旭副教授擔任共同通訊作者,碩士研究生祝浩冉為第一作者。該研究得到了國家自然科學基金青年基金和山東省自然科學基金項目經費的資助。
全文鏈接:
https://doi.org/10.1016/j.neunet.2025.108198
編 輯:萬 千
審 核:賈 波








