近日,聯想校企科研合作再出新成果。聯想研究院無線研究實驗室研究員張元濤、汪海明與中關村泛聯院研究員高海嘯,方澤川,黃靖洪,孫夢穎,許曉東等,作為共同作者參與研究的語義通信方向,有3篇論文被IEEE INFOCOM 2025 Poster session成功接受。
INFOCOM是國際計算機通信網絡領域的旗艦性會議,也是中國計算機學會(CCF)推薦的A類會議。其對論文的質量要求非常嚴格,INFOCOM 2025的論文接受率為20%左右。
此次入選的三篇論文分別是
- 《面向移動端AI生成全景視頻的自適應超分辨率語義通信》(Adaptive Super-Resolution Semantic Communication for Mobile AI-Generated Panoramic Video)
- 《面向視覺傳輸的生成式人工智能驅動的跨模態語義通信系統》(Generative AI-Driven Cross-Modal Semantic Communication System for Visual Transmission)
- 《VQ-SDSC:矢量量化衛星數字語義通信框架》(VQ-SDSC: Vector Quantized Satellite Digital Semantic Communication Framework)
語義通信是指通信雙方具有語義共識前提條件下面向語義可達意義上的通信,重點是確保通信雙方能夠互通含義,而不僅僅是符號傳遞。現代語義通信以AI和信息論等多學科的理論指導,對原始信號進行語義信息表征、提取、傳輸及恢復。與傳統通信相比,語義通信系統有更高的傳輸效率。基于深度神經網絡的語義通信系統可以廣泛應用于多模態數據,如文本,圖片和視頻的傳輸。
論文1:《面向移動端AI生成全景視頻的自適應超分辨率語義通信》
作者:高海嘯, 孫夢穎, 張元濤, 汪海明, 許曉東
沉浸式通信是6G技術的關鍵應用,使用戶能夠體驗360度全景視頻。人工智能生成全景視頻(AIGPV)技術的快速發展,為滿足沉浸式通信的多樣化需求提供了一種潛在的解決方案。移動AIGPV將視頻生成任務卸載到邊緣服務器和基站(ES-BS),允許資源有限的用戶訪問高質量的AIGPV服務。然而,當ES-BS需要同時為多個用戶提供服務時,向每個用戶請求高分辨率全景視頻可能會導致計算和傳輸資源不足等問題。
本文提出了一種用于移動AIGPV的超分辨率語義傳輸(SR-Sem)方案。在該方案中,用戶通過上行鏈路傳輸最少的文本信息,允許ES-BS生成低分辨率全景視頻并減少資源負載。為了提高視頻傳輸的效率和魯棒性,SR Sem利用基于深度聯合源信道編碼(deep JSCC)和注意力機制的語義通信,促進低分辨率視頻的自適應語義提取和可變長度編碼。此外,它在用戶端基于恢復的特征和上下文信息完成了全景視頻的超分辨率任務,有效地保證了用戶沉浸式體驗的質量。
論文2:《面向視覺傳輸的生成式人工智能驅動的跨模態語義通信系統》
作者:方澤川, 孫夢穎, 張元濤, 汪海明, 許曉東
語義通信專注于從源消息中傳輸語義信息,從而實現更高效、更智能的通信。然而,現有的基于深度學習的語義通信方法仍然面臨著重大挑戰,包括缺乏可解釋性,以及在不犧牲質量的情況下進一步壓縮傳輸數據的困難。與此同時,生成人工智能(Gen AI)的出現揭示了非凡的類人智能,為通過增強語義理解來推進跨模態語義交流提供了一種有前景的解決方案。
本文提出了用于視覺傳輸的Gen AI驅動的跨模態語義通信框架(GS-SemCom),以及一種使用多模態大語言模型(MLLM)的語義提取方法。該方法將原始圖像與背景知識相結合,生成圖像差異字幕。此外,我們還集成了聯合信源信道解碼,以確保可靠的傳輸。
論文3:《VQ-SDSC:矢量量化衛星數字語義通信框架》
作者:黃靖洪, 孫夢穎, 張元濤, 汪海明, 許曉東
衛星對于寬帶、高速和低延遲通信至關重要,但面臨著信號衰減、長延遲和干擾等挑戰。這些問題很難用傳統方法解決。
本文提出了一種矢量量化的衛星數字語義通信框架,其中衛星節點執行語義轉發以恢復丟失的信息,適應復雜的信道條件,并減輕中繼通信中的級聯衰落。我們還提出了一種聯合語義信息編碼調制方法,使用語義碼本對圖像特征進行量化和調制,同時使用神經網絡學習星座符號分布,以便在衰落信道下進行聯合訓練。
語義通信是AI在無線通信領域落地的重要技術實現方式,對于未來的6G標準具有重要的意義。語義通信是聯想研究院聚焦的重要前沿技術領域,此次論文被INFOCOM頂會接受充分體現了聯想在6G領域的研發實力和行業影響力。