近日,聯想集團有限公司(以下簡稱“聯想”)宣布基于聯想問天WA7780 G3服務器,在行業內首次實現單機部署DeepSeek-R1/V3 671B大模型,以低于行業公認1TB顯存(實際768GB)承載多并發用戶流暢體驗,可以滿足千人企業的使用需求,為行業樹立了企業級大模型部署新基準。
作為全球關注的焦點,眾多企業正準備在本地化部署DeepSeek大模型。然而,在落地實施過程中用戶普遍面臨以下關鍵決策難題:單機能否部署滿血版DeepSeek R1?如何確保高并發與吞吐量下的優質體驗?
聯想此次突破為企業提供科學選型指南。針對行業公認1TB顯存是千億參數大模型運行基線,聯想中國基礎設施業務群和研究院ICI實驗室組成的聯合攻關團隊通過專家并行優化、智能訪存架構升級等,大幅提升顯存利用率,實現性能的提升。
據了解,聯想問天WA7780 G3服務器在2月初已實現單機768GB GPU顯存條件下部署DeepSeek 671B R1和V3滿血模型,并能滿足中小企業的并發需求,通過聯想萬全異構智算平臺的訪存優化等技術優化手段,實現單機一個月內并發能力增長10倍。
業內認為,聯想技術突破將有效破除大模型落地瓶頸,顯著加速大模型在企業的落地進程。
聯想負責人表示,聯想中國基礎設施業務群與聯想研究院ICI實驗室將繼續合作,依托雙方聯合打造的聯想萬全異構智算平臺對DeepSeek平臺從AI預訓練、后訓練到推理的全流程進行持續優化,加速大模型的落地。