近日,群核科技在首屆技術(shù)開放日(TechDay)上正式發(fā)布其空間大模型最新成果:新一代空間語言模型SpatialLM 1.5與空間生成模型SpatialGen。SpatialLM 1.5支持用戶通過對話交互系統(tǒng)SpatialLM-Chat進(jìn)行可交互場景的端到端生成,它打破傳統(tǒng)大語言模型對物理世界幾何與空間關(guān)系的理解局限,可生成物理正確的結(jié)構(gòu)化場景。SpatialGen是一款基于擴(kuò)散模型架構(gòu)的多視角圖像生成模型,可生成3D高斯(3DGS)場景和渲染漫游視頻。
在TechDay 的現(xiàn)場,一個(gè)養(yǎng)老場景的演示讓在場觀眾眼前一亮:工作人員在 SpatialLM-Chat 對話系統(tǒng)中輸入 “去客廳餐桌拿藥”,短短幾秒后,系統(tǒng)不僅識別出 “客廳”“餐桌”“藥” 三個(gè)關(guān)鍵對象,還自動調(diào)用路徑規(guī)劃工具,生成了一條避開茶幾、椅子的最優(yōu)行動路線。
SpatialLM的空間參數(shù)化生成能力,可以高效創(chuàng)建具備物理準(zhǔn)確性的訓(xùn)練場景:首先基于自然語言描述生成結(jié)構(gòu)化空間方案,繼而自動匹配素材庫構(gòu)建三維環(huán)境,最終輸出可供機(jī)器人進(jìn)行路徑仿真的可交互場景。
圖說:SpatialLM 1.5 機(jī)器人訓(xùn)練演示demo
從技術(shù)迭代的角度來看,SpatialLM 1.5 的進(jìn)步是建立在 SpatialLM 1.0 的基礎(chǔ)上的。今年 3 月,群核開源 SpatialLM 1.0 后,該模型迅速登上 Hugging Face 趨勢榜前三,成為空間大模型領(lǐng)域的 “熱門工具”。更關(guān)鍵的是,已有初創(chuàng)企業(yè)基于 SpatialLM 1.0 的代碼和架構(gòu),訓(xùn)練出了適合自身場景的空間模型。
SpatialLM技術(shù)突破的背后,是群核構(gòu)建的「空間智能飛輪」正加速轉(zhuǎn)動;诳峒覙愤@一全球最大的空間設(shè)計(jì)平臺,群核科技構(gòu)建了“空間編輯工具-空間合成數(shù)據(jù)-空間大模型”的空間智能飛輪,讓工具沉淀數(shù)據(jù),用數(shù)據(jù)加速模型訓(xùn)練,用模型提升工具體驗(yàn),再在工具的廣泛應(yīng)用中沉淀更為豐富的場景數(shù)據(jù)。正如快手依托短視頻生態(tài)推動可靈迭代一樣,群核憑借酷家樂沉淀的海量室內(nèi)物理數(shù)據(jù),正在空間智能領(lǐng)域復(fù)現(xiàn)“工具—數(shù)據(jù)—模型”的技術(shù)增強(qiáng)回路。
數(shù)據(jù)顯示,截至2025年6月30日,群核科技擁有包含超過4.41億個(gè)3D模型及超過5億個(gè)結(jié)構(gòu)化3D空間場景。從酷家樂的數(shù)據(jù)積累到群核空間大模型的戰(zhàn)略升級,群核的技術(shù)飛輪效應(yīng)正在持續(xù)兌現(xiàn)。