本報訊 (記者李喬宇)近期,商湯集團股份有限公司(以下簡稱“商湯”)正式發布并開源了與南洋理工大學S-Lab合作研發的全新多模態模型架構——NEO,為日日新SenseNova多模態模型奠定了新一代架構的基石。
作為行業首個可用的、實現深層次融合的原生多模態架構(NativeVLM),NEO從底層原理出發,打破了傳統“模塊化”范式的桎梏,以“專為多模態而生”的創新設計,通過核心架構層面的多模態深層融合,實現了性能、效率和通用性的整體突破,重新定義了多模態模型的效能邊界,標志著人工智能多模態技術正式邁入“原生架構”的新時代。
當前,業內主流的多模態模型大多遵循“視覺編碼器+投影器+語言模型”的模塊化范式。這種基于大語言模型(LLM)的擴展方式,雖然實現了圖像輸入的兼容,但本質上仍以語言為中心,圖像與語言的融合僅停留在數據層面。這種“拼湊”式的設計不僅學習效率低下,更限制了模型在復雜多模態場景下(比如涉及圖像細節捕捉或復雜空間結構理解)的處理能力。
商湯NEO架構正是為了解決這一痛點而生。早在2024年下半年,商湯便在國內率先突破多模態原生融合訓練技術,以單一模型在SuperCLUE語言評測和OpenCompass多模態評測中奪冠,并基于這一核心技術打造了日日新SenseNova 6.0,實現多模態推理能力領先。之后,公司在2025年7月份發布日日新SenseNova 6.5,通過實現編碼器層面的早期融合,把多模態模型性價比提升3倍,并在國內率先推出商用級別的圖文交錯推理。商湯此次更進一步,徹底摒棄了傳統的模塊化結構,從底層原理出發,推出了從零設計的NEO原生架構。
目前,商湯已正式開源基于NEO架構的2B與9B兩種規格模型,以推動開源社區在原生多模態架構上的創新與應用。商湯表示,致力于通過開源協作與場景落地雙輪驅動,將NEO打造為可擴展、可復用的下一代AI基礎設施,推動原生多模態技術從實驗室走向廣泛的產業化應用,加速構建下一代產業級原生多模態技術標準。
(編輯 張偉)
| 23:42 | 兩部門發文促進文旅與民航業融合發... |
| 23:42 | 從寧波舟山港實現第四個“千萬箱級... |
| 23:42 | 11月份中國物流業景氣指數為50.9% |
| 23:42 | 李強主持國務院第十七次專題學習 |
| 23:42 | 前10個月我國服務進出口總額同比增... |
| 23:42 | 多地加碼購房補貼支持住房消費 |
| 23:42 | 多家外資機構發布研報樂觀預期A股... |
| 23:42 | 四重支撐勾勒A股市場長期向好運行... |
| 23:42 | 離岸人民幣對美元匯率盤中升破7.06... |
| 23:42 | 數據新政釋放紅利 構建學科人才培... |
| 23:42 | 折疊屏手機賽道硝煙再起 產業鏈創... |
| 23:42 | 京東工業啟動招股擬全球發售2.11億... |
版權所有《證券日報》社有限責任公司
互聯網新聞信息服務許可證 10120240020增值電信業務經營許可證 京B2-20250455
京公網安備 11010602201377號京ICP備19002521號
證券日報網所載文章、數據僅供參考,使用前務請仔細閱讀法律申明,風險自負。
證券日報社電話:010-83251700網站電話:010-83251800 網站傳真:010-83251801電子郵件:xmtzx@zqrb.net
安卓
IOS
掃一掃,加關注
掃一掃,加關注