本報記者 許林艷
11月4日,由中國信息通信研究院組織召開的“存力中國行暨先進存力AI推理工作研討會”在北京順利召開。本次會議深入探討了AI時代下先進存力賦能AI大模型發展的支撐作用。
中國信息通信研究院首席專家石友康出席研討會并致辭,中國信息通信研究院云大所總工程師郭亮主持。中國移動云能力中心項目總師周宇,華為數據存儲產品線戰略與業務發展部總裁王旭東,北京硅基流動科技有限公司解決方案總監唐安波發表主題演講。
研討會上,中國信息通信研究院首席專家石友康深刻闡述了當前AI規模化應用推進,推理環節的成本、效率、質量問題凸顯,先進存力成為提升AI推理效能、控制成本的關鍵。當前,國家高度重視先進存力發展,在《算力基礎設施高質量發展行動計劃》等政策中明確提出“加速存力技術研發應用”“持續提升存儲產業能力”“推動存算網協同發展”,為產業發展指明了方向。中國信息通信研究院在政策研究、標準制定、測試服務等方面開展多項工作,并聯合產業鏈企業成立“算力產業發展方陣先進存力AI推理工作組”,同時提出了三點建議:鼓勵前沿存儲技術研發創新,推動存算運深度融合,加強存算協同產業生態建設,呼吁業界同仁凝聚共識,共同推動我國存算協同發展。
周宇分享了面向推理的存儲技術趨勢與實踐,圍繞推理挑戰、存儲破局及趨勢判斷展開。當前推理面臨KV Cache存儲需求升級、多模態數據協同、存算協同帶寬不足、負載潮汐性及成本控制等挑戰。移動云針對性采用分層緩存調度、高速數據互聯技術提升帶寬、多模數據專屬存儲與標準化、架構池化重組等技術破局,還通過高密全閃存儲、數據縮減、自研SPU高密服務器提高存儲效能和降低成本。未來趨勢上,移動云推動存儲從被動存儲轉向智算協同,分階段落地高密全閃存儲、數據高速互聯、存算一體等技術,長遠構建池化多體存儲體系,同時強調技術整合與生態協同。
王旭東介紹了AI時代,IT基礎設施能力面臨三大挑戰:“管不好”的數據、“喂不飽”的算力、“降不下”的成本。推理數據來源多樣難以形成高質量、可持續供應的數據集,存儲系統的帶寬和IOPS(每秒讀寫次數)不足,導致GPU等昂貴算力資源長時間空閑。傳統存儲架構難以兼顧高吞吐、低時延及異構數據融合的需求,造成業務發展瓶頸,阻礙AI應用落地。華為針對AI推理研發的UCM推理記憶數據管理技術在行業落地中的核心作用,通過“集中高質數據、提速AI訓練、優化推理效能”三個角度,打造AI推理加速解決方案。
唐安波在會上圍繞大模型推理“推不動、推得慢、推得貴”問題展開分享,硅基流動構建的AI infra工具鏈,聚焦提升算力利用率。核心推理框架適配100多款開源大模型,并通過公有云服務平臺為廣大開發者和企業提供優質的大模型服務。解決方案上,結合UCM技術卸載KVCache釋放顯存、提升推理性能,同時通過智能網關進一步優化流量調度、彈性擴縮容等策略,來應對高并發、低延時、高吞吐、長上下文等痛點,基于存儲的KVCache方案可大幅提升系統吞吐。
在內部研討環節,參會專家圍繞算力產業發展方陣先進存力AI推理工作組下一階段工作建議進行研討,中國移動云能力中心、華為、硅基流動、浪潮信息、清微智能、東方算芯、智元芯、算苗科技、得一微電子等工作組成員單位參與討論,貢獻實踐經驗。存力中國行暨先進存力AI推理工作研討會的成功舉辦,為存力產業創新發展凝聚共識,指明方向。
(編輯 郭之宸)
| 23:42 | 兩部門發文促進文旅與民航業融合發... |
| 23:42 | 從寧波舟山港實現第四個“千萬箱級... |
| 23:42 | 11月份中國物流業景氣指數為50.9% |
| 23:42 | 李強主持國務院第十七次專題學習 |
| 23:42 | 前10個月我國服務進出口總額同比增... |
| 23:42 | 多地加碼購房補貼支持住房消費 |
| 23:42 | 多家外資機構發布研報樂觀預期A股... |
| 23:42 | 四重支撐勾勒A股市場長期向好運行... |
| 23:42 | 離岸人民幣對美元匯率盤中升破7.06... |
| 23:42 | 數據新政釋放紅利 構建學科人才培... |
| 23:42 | 折疊屏手機賽道硝煙再起 產業鏈創... |
| 23:42 | 京東工業啟動招股擬全球發售2.11億... |
版權所有《證券日報》社有限責任公司
互聯網新聞信息服務許可證 10120240020增值電信業務經營許可證 京B2-20250455
京公網安備 11010602201377號京ICP備19002521號
證券日報網所載文章、數據僅供參考,使用前務請仔細閱讀法律申明,風險自負。
證券日報社電話:010-83251700網站電話:010-83251800 網站傳真:010-83251801電子郵件:xmtzx@zqrb.net
安卓
IOS
掃一掃,加關注
掃一掃,加關注