CVPR全稱IEEE國際計算機視覺與模式識別會議(IEEE Conference on Computer Vision and Pattern Recognition),該會議始于1983年,每年舉辦一次,是計算機視覺和模式識別領域的國際頂級會議。根據谷歌學術公布的2021年最新學術期刊和會議影響力排名,CVPR在所有學術刊物中位居第4,僅次于Nature,NEJM和Science。張健助理教授課題組分別在圖像隱寫/高光譜圖像重建/自然圖像重建等底層視覺研究方向共有3篇論文被CVPR 2022錄用。
圖像隱寫術(Image Steganography)旨在隱秘地將隱藏信息嵌入到一張與宿主圖像近似的容器圖中。此前的隱寫方案通常將隱寫和重建視為兩部分網絡進行構建,難以同時保證可靠的重建質量和隱秘性;現有技術對網絡傳輸中的噪聲和壓縮也相當敏感,容器圖上輕微的干擾即可能影響重建質量。如圖1所示,論文“Robust Invertible Image Steganography”提出了一種可逆圖像隱寫方法,通過設計條件標準化流模型(Conditional Normalizing Flow),將圖像的隱寫和解密視作一對逆問題加以聯合高效求解。為了提升隱寫容量和重構質量,論文提出了分布映射模塊,能夠給重建過程提供有效引導,從而保留隱藏圖的更多高頻信息。同時,在端到端訓練中引入了對各類失真的模擬,在重建網絡中設計了圖像增強模塊以提升魯棒性。綜上,論文構建了一個強魯棒性的高效圖像隱寫框架,在水印鑒權、換臉檢測、屏顯隱藏圖像等方面有著廣泛應用。該工作由課題組獨立完成,論文通訊作者為張健助理教授,信息工程學院為第一作者單位,許佑民同學為第一作者,合作者還包括課題組的牟沖同學、胡妤婕同學、謝靜芬同學。
光譜壓縮感知被廣泛地應用在成像系統上,其目的是利用二維傳感器來捕捉三維的高光譜信號,進而取得低帶寬、高計算通量的優勢。成像系統通過硬件編碼器壓縮二維信號,隨后運用重建算法實現高維信號的復原。然而,現有的方法均存在一定的局限性,如基于模型的方法迭代時間較長,實時性差;基于網絡的方法又缺乏一定的可解釋性。論文“HerosNet: Hyperspectral Explicable Reconstruction and Optimal Sampling Deep Network for Snapshot Compressive Imaging”研究的內容是可解釋深度神經網絡在光譜壓縮感知上的應用。課題組的研究表明,基于深度展開的方法能夠很好地利用兩種方法的優勢,并有效解決現有深度展開方法中缺乏跨階段特征交互和自適應參數調整的問題。該研究結果所設計的深度展開網絡受優化方法中的近鄰映射啟發,網絡結構如圖2所示,能夠聯合實現掩膜優化和高光譜重建。該網絡通過引入動態梯度下降模塊來模擬采樣矩陣,自適應地更新迭代步長;該網絡通過層級特征交互模塊,融合之前階段的特征用以重建當前階段的圖像。論文通訊作者為張健助理教授,信息工程學院為第一作者單位,張軒宇同學為第一作者,合作者還包括香港中文大學孫啟霖助理教授、哈爾濱工業大學(深圳)張永兵教授和北京大學熊瑞勤教授。
自然圖像重建具有廣泛的應用價值,可以顯著提升圖像或視頻的視覺質量。現有圖像重建方法在性能和模型可解釋性上都存在一定的缺陷。論文“Deep Generalized Unfolding Networks for Image Restoration”針對現有的缺陷研究了可解釋性網絡在自然圖像重建上的應用。研究表明,優化啟發式的網絡設計在提升模型可解釋性的同時也可以提升模型性能。如圖3所示,論文設計的新型深度展開網絡由近端梯度下降算法(PGD)展開而成,每個階段的網絡結構由數據模塊和先驗模塊交替堆疊而成,其中引入級間跳躍連接來個改進傳統算法中存在的信息損失。通過可學習模塊替換傳統算子,所設計的模型具有良好的自適應能力,同時保持了良好的可解釋性,在多個自然圖像重建任務中取得了領先性能。該工作由課題組獨立完成,論文通訊作者為張健助理教授,信息工程學院為第一作者單位,牟沖同學為第一作者,論文合作者還包括課題組的王茜同學。
以上三項研究成果得到了深圳市基礎研究專項以及國家自然科學基金的支持,在算力方面得到了深圳鵬城實驗室的“鵬城云腦”支持。
您填的信息已提交,老師會在24小時之內與您聯系
如果還有其他疑問請撥打以下電話