藍鯨新聞 6 月 6 日訊(記者 武靜靜)2025 年 6 月 6 日,第七屆智源大會在北京召開,智源研究院正式發布了 " 悟界 " 系列大模型,聚焦多模態、腦科學、具身智能與微觀生命分子建模四大核心方向。
創立于 2018 年的智源研究院,作為中國新型科研機構的探索樣本,它不僅開創了國產大模型的技術路線,也激活了中國 AI 大模型創業生態的第一波熱潮——它催生了國內最早一批專注于大模型的創業公司,也影響了以楊植麟、豈凡超、曾國洋等人為代表的新一代 AI 大模型創業者。他們大多曾參與 " 悟道 1.0" 與 "2.0" 的研發,在項目中完成從學生到研究者的轉變,成為中國 AI 大模型版圖中的重要力量。
今天的 " 悟界 ",是繼 " 悟道 " 之后智源邁出的又一步。不同于以往聚焦語言、圖像等數字世界," 悟界 " 面向具身智能和世界建模,將探索延伸至真實世界中的感知、決策與交互。
此次,「藍鯨科技」采訪了智源研究院院長王仲遠,圍繞 " 悟界 " 背后的研究邏輯、技術布局與未來方向展開深入對話,了解智源對下一代通用人工智能 " 底座能力 " 的一次系統性構思與前瞻性思考。
大模型技術還遠沒有到發展的盡頭,下一步是探索物理世界
" 界 " 代表著對虛實世界邊界的突破,代表著對物理世界的賦能,以及在物理 AGI 方向上的邁進,王仲遠說道。
據介紹,此次發布的 " 悟界 " 系列涵蓋原生多模態世界模型 Emu3、腦科學多模態通用基礎模型見微 Brain μ、跨本體具身大小腦協作框架 RoboOS 2.0 與具身大腦 RoboBrain 2.0 以及全原子微觀生命模型 OpenComplex2,幾乎覆蓋了當下 AI 與人類核心認知結構、現實物理世界交互及生命本質建模的前沿方向,也是中國大模型再一次面向通用人工智能(AGI)一次探索和實踐。
我們了解到,此次智源推出的 " 悟界 " 系列模型,首次系統性地覆蓋多模態、腦科學、具身智能與微觀生命分子建模,展現出構建 " 世界模型 " 的路徑圖,也體現了中國 AI 方面系統化創新能力。
這正是 " 悟界 " 系列試圖解決的問題,王仲遠表示,要讓 AI 真正從 " 只能聊天 " 走向 " 能理解、能行動 " 的階段,關鍵在于讓它真正進入現實世界。為此,智源不再只依靠互聯網文本數據,而是引入更多來自真實世界的信息,比如圖像、聲音、三維空間結構,甚至是人腦的活動信號。
智源正在探索一種叫 " 原生多模態 " 的新方法——簡單來說,就是從模型訓練的第一步開始,就同時使用多種類型的數據,讓 AI 從一開始就具備綜合理解各種信息的能力。
Emu3 原生多模態世界模型就是這種做法的代表,它可以把文字、圖片、視頻轉化為同一種 " 語言 " 來處理,這樣就能更順暢地理解和生成不同形式的內容,讓 AI 變得更聰明、更靈活。此外,智源推出的見微 Brain μ 模型,就能把腦信號轉化為模型可以處理的 " 語言 ",并與圖像和文本進行跨模態多向映射。
更進一步,大模型未來需要具備對空間位置和時間變化的感知能力,比如判斷一個杯子是否快要從桌邊掉下去。這類時空理解對于未來 AI 機器人在現實中完成任務至關重要。王仲遠認為,這種面向物理世界的原生多模態模型,將是實現真正 " 物理 AGI" 的路徑之一。
具身智能仍處于探索期,類似大語言模型的 GPT-3 之前階段
隨著 AI 正從數字世界走入真實空間,具身智能正在成為當下另一個熱議的話題和技術攻堅領域,也在陸續誕生各種創業公司。
王仲遠向「藍鯨科技」談到:" 具身智能目前仍處于技術探索的早期階段,類似于大模型在 GPT-3 之前的摸索期。"
他提到,當下具身智能面臨多重挑戰。一方面,核心技術路徑尚未明確,如仿真數據利用和 " 大小腦 " 融合架構等仍在探索中,技術復雜度遠超智能駕駛。另一方面,數據采集困難是具身智能發展的重要瓶頸。真機數據獲取受限于現有模型能力,形成 " 循環悖論 ",加之真實世界多模態數據雖然豐富,卻難以高效利用。
此外,軟硬件協同復雜,特別是跨本體 " 大小腦 " 融合尚未成熟,導致產業落地周期長,缺乏明確的規模化應用。" 未來 5-10 年,大小腦融合的模型可能會成熟,但不是今天。" 王仲遠說。
智源發布的具身大腦 RoboBrain 2.0 是目前全球最強的開源具身大腦大模型,在多項空間推理與任務規劃指標上超越具身智能領域主流大模型。
王仲遠透露," 在數據訓練的技術路徑上,智源借鑒了大語言模型的發展思路,更多依靠的是互聯網數據幫助機器人學習智能 ... 再通過強化學習和少量真實世界的數據不斷訓練它的能力,不斷突破具身智能的發展上限。"
他借用了一個視頻比喻:" 就像一個小朋友先通過看短視頻學會怎么拆糖果,再通過實際操作(強化學習)逐步掌握這項技能。"
此外,為了讓大模型更好的用起來,此次智源發布了跨本體具身大小腦協作框架 RoboOS 2.0,這是全球首個基于具身智能 SaaS 平臺,可以支持 MCP 的跨本體具身大小腦協作框架,目標是構建具身智能領域的 " 應用商店 " 生態。
同時,RoboOS 2.0 也是全球首個支持 MCP 的跨本體具身大小腦協作框架,旨在構建具身智能領域的 " 應用商店 " 生態。
王仲遠詳細介紹稱,"RoboOS 2.0 實現了小腦技能的免適配注冊機制,顯著降低開發門檻。典型場景下,相關代碼量僅為傳統手動注冊方式的 1/10。這使得開發者能夠更容易地貢獻和分享小腦技能。"
目前,RoboOS 2.0 與 RoboBrain 2.0 已全面開源,包括框架代碼、模型權重、數據集與評測基準。且智源研究院已與全球 20 多家具身智能企業建立戰略合作關系。
對于具身智能接下來的發展趨勢,王仲遠談到,具身智能的大規模商用落地尚需時日。未來 3 年內,突破性的規模化應用最可能首先出現在特定、相對封閉的場景,尤其有大量重復、枯燥甚至危險的任務,非常適合具身智能第一波切入。