6 月 6 日消息,在 2025 智能經(jīng)濟(jì)論壇上,百度集團(tuán)執(zhí)行副總裁、百度智能云事業(yè)群總裁沈抖宣布,目前已有 65% 的央企選擇與百度智能云開展深度合作,同時(shí)百度智能云發(fā)布千帆慧金金融大模型,并推出了覆蓋能源、交通、汽車、醫(yī)療、環(huán)境等領(lǐng)域的精選行業(yè)場(chǎng)景智能體家族。
百度摸索行業(yè)大模型,金融領(lǐng)域做試點(diǎn)
行業(yè)大模型是指基于通用大模型技術(shù)底座,在落地到特定行業(yè)時(shí),針對(duì)特定行業(yè)需求和應(yīng)用場(chǎng)景融入大量行業(yè)特定的數(shù)據(jù)和知識(shí),從而在專業(yè)領(lǐng)域內(nèi)表現(xiàn)出更高的準(zhǔn)確性和實(shí)用性。
一個(gè)關(guān)鍵的問題是,行業(yè)大模型由誰來構(gòu)建?
如果是垂直行業(yè)頭部廠商,領(lǐng)域內(nèi)其他廠商可能心存顧慮,擔(dān)心自己的核心數(shù)據(jù)安全,以及是否會(huì)越來越落后于頭部廠商;如果是通用大模型廠商,核心數(shù)據(jù)從哪來,行業(yè)知識(shí)是否足夠,行業(yè)廠商能否認(rèn)可,同樣是問題。
百度智能云以自己積累較多的金融領(lǐng)域?yàn)樵圏c(diǎn),探索行業(yè)大模型的可行性。沈抖表示,基礎(chǔ)模型能力再?gòu)?qiáng),直接放到具體的行業(yè)場(chǎng)景中,效果往往不達(dá)預(yù)期。
拿金融行業(yè)來說,金融對(duì)大模型的要求非常高,知識(shí)面廣、時(shí)效性強(qiáng),而且對(duì)大模型的準(zhǔn)確性和幻覺率要求更嚴(yán)格。通用模型因?yàn)槿狈iT金融語料的訓(xùn)練,很難精準(zhǔn)回答,容易出現(xiàn)幻覺。
更重要的是,真正有價(jià)值的金融數(shù)據(jù),大多掌握在機(jī)構(gòu)內(nèi)部。企業(yè)想基于這些數(shù)據(jù)做精調(diào),面臨兩個(gè)難題:一是效果好的基座模型,往往參數(shù)規(guī)模都是千億級(jí),訓(xùn)練一輪成本高、周期長(zhǎng);二是部署大參數(shù)模型需要大量算力,成本也很高。
因此百度智能云以金融行業(yè)為試點(diǎn),推出千帆金融行業(yè)大模型 " 千帆慧金 "。在通用模型的基礎(chǔ)上,對(duì)研報(bào)、財(cái)報(bào)、專業(yè)書籍等海量金融數(shù)據(jù)做了深度清洗和挖掘,整理出數(shù)百億 tokens 的高質(zhì)量金融領(lǐng)域語料,同時(shí)做了包括指令對(duì)齊、知識(shí)增強(qiáng)、訓(xùn)練、推理策略等一系列優(yōu)化。
在它的基礎(chǔ)上,針對(duì)行業(yè)復(fù)雜計(jì)算任務(wù),百度智能云系統(tǒng)優(yōu)化了模型思維鏈,進(jìn)一步研發(fā)了千帆慧金金融推理增強(qiáng)大模型。每個(gè)模型都提供大、小兩個(gè)版本,8B 版本小參數(shù)模型,響應(yīng)快、易部署,適用于意圖識(shí)別、指標(biāo)抽取等對(duì)速度要求高、任務(wù)相對(duì)明確的場(chǎng)景;70B 大參數(shù)版本更適合處理投研輔助、策略分析等復(fù)雜推理和多輪任務(wù)規(guī)劃問題。
這兩個(gè)模型都支持最長(zhǎng) 32K 的上下文輸入,可以覆蓋金融行業(yè)絕大多數(shù)場(chǎng)景。在金融領(lǐng)域的多個(gè)數(shù)據(jù)集評(píng)測(cè)中,以百億參數(shù)規(guī)模實(shí)現(xiàn)了超過千億參數(shù)通用模型的效果。
智能體,大模型下一個(gè)戰(zhàn)場(chǎng)
沈抖表示,AI 產(chǎn)品體驗(yàn)不斷優(yōu)化,正在從 " 能用 " 走向 " 好用 "。越來越多的領(lǐng)先企業(yè)堅(jiān)定攻關(guān)大模型,并且重點(diǎn)已經(jīng)從最初的提示詞優(yōu)化,走向了更系統(tǒng)化的智能體應(yīng)用構(gòu)建。
從行業(yè)視角觀察,2025 年被認(rèn)為是 Agent 元年,可能并不是真正意義上智能體大爆發(fā)的元年,而是更多企業(yè)的投入重心轉(zhuǎn)為智能體領(lǐng)域。
這也與行業(yè)對(duì)大模型的認(rèn)知加深有關(guān),當(dāng)面對(duì)復(fù)雜任務(wù)和多樣化的應(yīng)用場(chǎng)景時(shí),單純依靠提示詞已難以充分發(fā)揮大模型的潛力,例如一些需要模型自主決策、持續(xù)交互以及調(diào)用外部工具的場(chǎng)景中,提示詞優(yōu)化難以實(shí)現(xiàn)任務(wù),促使行業(yè)開始尋求更具自主性和智能性的解決方案。
咨詢機(jī)構(gòu) IDC 預(yù)計(jì),2025 年生成式 AI 在企業(yè)的落地仍將優(yōu)先聚集在辦公助手等提升生產(chǎn)力的場(chǎng)景,其次是行業(yè)垂直業(yè)務(wù)場(chǎng)景。金融、能源、零售、制造是最值得關(guān)注的傳統(tǒng)行業(yè)。從另一個(gè)角度,智能體將是大模型應(yīng)用的重要方向,流程自動(dòng)化,RPA,CRM,數(shù)字員工將優(yōu)先受益于智能體升級(jí)。
以能源電力領(lǐng)域?yàn)槔俣戎悄茉坡?lián)合國(guó)家電網(wǎng)打造了 " 營(yíng)銷供電方案智能體 ",用戶通過國(guó)網(wǎng) App 提交需求后,智能體可自動(dòng)識(shí)別意圖、拆解任務(wù),調(diào)用專家模型和多種工具核驗(yàn)信息、填報(bào)工單,并生成多套供電方案,支持動(dòng)態(tài)優(yōu)化與智能推薦。
在交通領(lǐng)域,百度發(fā)布了 " 公路應(yīng)急指揮智能體 ",已在河北京雄高速落地使用,能高效識(shí)別如異常停車等突發(fā)事件,并快速生成處置預(yù)案,顯著縮短應(yīng)急響應(yīng)時(shí)間。該智能體通過大小模型協(xié)作,有效彌補(bǔ)了傳統(tǒng)小模型在連續(xù)狀態(tài)識(shí)別方面的短板,預(yù)警準(zhǔn)確率提升至 95% 以上,體現(xiàn)了 AI 在復(fù)雜應(yīng)急場(chǎng)景中的實(shí)戰(zhàn)價(jià)值。
沈抖表示,百度智能體已經(jīng)針對(duì)行業(yè)場(chǎng)景做了深度優(yōu)化,內(nèi)置了特定的大、小模型、行業(yè)知識(shí)、行業(yè)標(biāo)準(zhǔn)流程和常用工具,對(duì)于同行業(yè)的客戶具備一定的通用性,百度智能云精選 " 行業(yè)場(chǎng)景智能體家族 " 已在千帆平臺(tái)全面上線。
" 客戶、伙伴只需要對(duì)它們做一些輕量定制,就可以把這些能力快速嵌入到自己的業(yè)務(wù)系統(tǒng)。在我們和很多客戶的實(shí)踐中,‘輕量定制行業(yè)智能體’,正在成為大模型產(chǎn)業(yè)落地的最快路徑。" 沈抖說。
此外他提到,也有不少客戶希望進(jìn)一步打造更貼合自身業(yè)務(wù)的智能體,從輕量定制走向系統(tǒng)化構(gòu)建,此時(shí)需要考慮的三個(gè)關(guān)鍵問題是:怎么開發(fā)、選什么模型、用什么算力。
在開發(fā)層面,百度智能云千帆平臺(tái)可提供企業(yè)級(jí)智能體工廠,客戶在千帆上課直接使用百度提供的成熟智能體,未來百度智能云計(jì)劃通過 A2A 等協(xié)議,供客戶調(diào)用更多來自百度集團(tuán)內(nèi)部、上下游合作伙伴的第三方智能體;企業(yè)也可開發(fā)自己的智能體,通過 MCP 協(xié)議連接企業(yè)內(nèi)外部的服務(wù)。
沈抖說,千帆不僅可以跑在公有云上,也支持私有化部署。即使是私有化部署,也不會(huì) " 鎖死 " 在某個(gè)版本。千帆的 " 私有化 " 本質(zhì)是 " 私有化訂閱 " 嗎,每當(dāng)模型或平臺(tái)有重大升級(jí),百度將新的更新推送到客戶業(yè)務(wù)系統(tǒng)。
模型層面,4 月份百度發(fā)布了兩款旗艦?zāi)P停何男?4.5 Turbo 和對(duì)應(yīng)的推理模型 X1 Turbo。文心 4.5 Turbo 的多模態(tài)理解效果提升超過 30%,在多個(gè)測(cè)試集上追平甚至部分超越了 OpenAI 的最新模型 GPT 4.1,而價(jià)格只是 GPT 4.1 的 6%,DS V3 調(diào)用價(jià)格的 40%。
算力層面,沈抖著重介紹了昆侖芯 P800,采用了完全由昆侖芯自研的 XPU-P 架構(gòu),顯存遠(yuǎn)超同類芯片,CUDA 上能跑的大模型,P800 都可以跑,而且遷移成本非常低。
沈抖透露,2 月百度點(diǎn)亮了 P800 的萬卡集群,4 月點(diǎn)亮了 3 萬卡集群,在這么大的規(guī)模上采用昆侖芯 P800 和海光 CPU 的全國(guó)產(chǎn)方案,屬于國(guó)內(nèi)首個(gè)。目前國(guó)家電網(wǎng)、中國(guó)鋼研、招商銀行,以及北大、同濟(jì)等高校和互聯(lián)網(wǎng)企業(yè),已經(jīng)開始規(guī)模部署 P800。
在昆侖芯之外,百舸還適配多款主流芯片,向下兼容各種芯片、屏蔽底層差異,向上也適配了各種主流的大模型框架,支持包括 DeepSeek 在內(nèi)的國(guó)產(chǎn)開源模型的訓(xùn)練和推理。
使用百舸 + 昆侖芯的方案,單卡吞吐性能相比國(guó)內(nèi)主流芯片方案可以高出 90%;大規(guī)模高并發(fā)模型推理速度可以提升 40% 以上。以百度和長(zhǎng)安汽車共建的長(zhǎng)安汽車智算中心為例,依托百舸平臺(tái)和客戶自研的 " 星環(huán)平臺(tái) ",集群平均算力使用率可以達(dá)到 90% 以上,綜合資源利用率提升 50%。(本文首發(fā)于鈦媒體 APP,作者 | 張帥,編輯 | 蓋虹達(dá))