微軟將 Sora 免費(fèi)了,但卻已經(jīng)晚了。
前天,微軟 Bing 宣布在其應(yīng)用程序中推出 Bing 視頻創(chuàng)作器(Bing Video Creator),該功能基于 OpenAI 的 Sora 模型,允許用戶通過(guò)文本提示詞生成視頻。這也是 Sora 首次面向用戶免費(fèi)開放。
就在昨天,Manus 推出原生文生視頻,嵌入進(jìn)了自家 Agent 的工作流中。
一個(gè)是默默關(guān)注 Sora、OpenAI 背后的 " 大東家 ",另一個(gè)則是 AI Agent 里的 " 新秀 ",兩方在自家產(chǎn)品生態(tài)中上馬文生視頻的時(shí)間點(diǎn)幾乎是一樣的??梢姡④涍@一步棋到底慢了多久。
為什么說(shuō)它是 Sora 的副產(chǎn)品?因?yàn)槲④浬暇€的 Bing 視頻創(chuàng)作器從產(chǎn)品力和宣傳上來(lái)講,很難說(shuō)得上是個(gè)完整的產(chǎn)品。
當(dāng)微軟終于宣布將它免費(fèi)向用戶開放時(shí),這個(gè)消息并未掀起預(yù)期中的熱潮,反而透著一股尷尬的遲到感。網(wǎng)友對(duì)這款產(chǎn)品的 " 自來(lái)水 " 評(píng)價(jià)很差,甚至直言:我們已經(jīng)有了可靈和 Veo,為何還用 Sora?
下面讓我們來(lái)看看,在微軟與 OpenAI 的復(fù)雜博弈中上線的 Bing 視頻創(chuàng)作器,到底體驗(yàn)如何?
一、微軟的 Sora,這回表現(xiàn)如何?
當(dāng) OpenAI 首次官宣 Sora 時(shí),"Sora 的誕生是牛頓時(shí)刻 " 的說(shuō)法迅速刷屏網(wǎng)絡(luò),甚至激發(fā)了諸多科技大廠的產(chǎn)品靈感與探索方向。當(dāng)時(shí)的 OpenAI 用實(shí)際宣發(fā)告訴所有人:AI 得這么玩。
盡管如今文本生成視頻已經(jīng)成了 " 爛大街 " 的常規(guī)功能,但在當(dāng)時(shí)幾乎只有 Sora 成功出圈了。
不過(guò),免費(fèi)歸免費(fèi),微軟的 Bing 視頻生成器目前仍存在明顯局限:視頻長(zhǎng)度僅限 5 秒,畫面比例只有 9:16 可選,且同時(shí)最多只能排隊(duì)生成三個(gè)視頻。更尷尬的是,其生成速度也頗為感人,F(xiàn)ast 模式尚需幾分鐘,Standard 模式甚至要耗費(fèi)數(shù)小時(shí),難免讓人懷疑微軟究竟獲得了 OpenAI 多少的資源支持。
沒錯(cuò),這個(gè) " 產(chǎn)品 " 只有下面這 4 個(gè)可選項(xiàng):
(1)羊駝穿西裝在冰上跳舞
提示詞:
一只羊駝穿著藍(lán)色的西裝,像人一樣雙腿直立,在中央公園的冰面上跳著動(dòng)感舞曲
An alpaca wearing a blue suit and standing upright on its legs like a human being, dances a dynamic dance on the ice in Central Park
Bing 視頻生成器:
畫面主體羊駝辨識(shí)度低,背景 AI 感強(qiáng)烈,動(dòng)作雖流暢,但整體質(zhì)感回到了一年前。如果我不提誰(shuí)能看得出來(lái)這是只羊駝?
緊接著,我同樣用 OpenAI 的 Sora 試了下一模一樣的提示詞。畫面的視覺效果明顯上了一個(gè)層次,無(wú)論是顏色的層次感、畫面主體的動(dòng)作流暢度,甚至是冰面的陰影的顯示都很真實(shí)。
接下來(lái)就是可靈 2.1 大師版了。雖然用最新出的模型去對(duì)比 Sora 有點(diǎn)欺負(fù)人,但是 2.1 的普通模式無(wú)法文生圖,也就只能出出血,拿大師版試一下了。
可以看得出來(lái),運(yùn)鏡設(shè)計(jì)創(chuàng)意比較好,畫面連貫且風(fēng)格統(tǒng)一,動(dòng)作復(fù)雜性和自然程度也很高。
相比之下,即夢(mèng)的效果就比較抽象了。風(fēng)格略顯割裂,背景像是綠幕效果,動(dòng)作重復(fù)且表情僵硬,整體表現(xiàn)不佳。我很懷疑是否是我的提示詞給錯(cuò)了。
谷歌的 Veo3 效果依舊耐打,視頻整體視覺效果流暢,畫面連貫性比較好。色彩正常偏明亮,動(dòng)作和表情也比較自然不僵硬。但是沒有運(yùn)鏡,鏡頭語(yǔ)言比較單一。Veo 3 的真實(shí)感和流暢度確實(shí)都很好。
一個(gè)空的玻璃茶杯內(nèi)有旋轉(zhuǎn)的彩色光芒,杯身放置在木桌上,木桌上映出茶杯明亮的倒影。鏡頭緩緩向茶杯靠近。
An empty glass teacup with a swirling colored glow inside is placed on a wooden table, which reflects the bright reflection of the teacup. The camera slowly moves closer to the teacup.
茶杯這個(gè)例子是我從 Bing 視頻生成器的官方推薦靈感庫(kù)里找到的,效果只能說(shuō)勉強(qiáng)貼合提示詞,但色彩生硬,整體視覺感受奇怪。
我還放了幾個(gè)官方 Case,大家可以自行評(píng)判效果:
如今,圍繞 AI 下半場(chǎng)的討論熱火朝天,但無(wú)論爭(zhēng)論的焦點(diǎn)如何變化,"AI 下半場(chǎng)比拼的是產(chǎn)品能力 " 已經(jīng)成為行業(yè)共識(shí)。然而,OpenAI 旗下的 Sora 產(chǎn)品因價(jià)格高昂和發(fā)布延期,幾乎已從主流 "AI 視頻工具 " 的競(jìng)賽中 Out 了。
從 2024 年初開始,現(xiàn)象級(jí)別的 Sora 帶給所有關(guān)注者的不是驚喜,而是不斷的懵圈:不斷延期的同時(shí),每隔一段時(shí)間就釋放一些新的令人驚艷的 " 小道消息 ",展示自身的強(qiáng)大能力。終于,在年末時(shí),Sora 終于發(fā)布了,奧特曼甚至稱它為 " 視頻版的 GPT-1"。
媒體 VentureBeat 在一篇評(píng)論中直言:"Sora 上市時(shí)萬(wàn)眾矚目,但不到一年,其光環(huán)已經(jīng)大幅褪色。"Sora 的發(fā)布頻繁跳票,錯(cuò)過(guò)了 AI 視頻產(chǎn)品的黃金發(fā)展期,其背后離不開大東家微軟與 OpenAI 之間錯(cuò)綜復(fù)雜的博弈。
微軟與 OpenAI 在 AI 領(lǐng)域的合作關(guān)系,從一開始發(fā)展得非常要好到 " 心生嫌隙 ",幾乎貫穿了這款產(chǎn)品的研發(fā)周期。從 2023 年下半年開始,自 OpenAI 推出自有企業(yè)版產(chǎn)品之后,微軟就不再 " 完全相信 "OpenAI 了。
在那場(chǎng)圍繞 OpenAI CEO 奧特曼的宮斗風(fēng)波中,微軟深度介入?yún)f(xié)調(diào),但雙方管理層之間仍舊出現(xiàn)了很多矛盾:?jiǎn)T工之間互相不爽,OpenAI 團(tuán)隊(duì)依靠自有技術(shù)高人一等,微軟團(tuán)隊(duì)也對(duì)分享前沿技術(shù)持保守態(tài)度。這個(gè)時(shí)候,微軟內(nèi)部就已經(jīng)有呼聲希望盡快將 Sora 整合進(jìn)產(chǎn)品線了。
在 2024 年,微軟招攬 Mustafa Suleyman 負(fù)責(zé)自家 AI 業(yè)務(wù),更加明確了 " 擺脫對(duì) OpenAI 依賴 " 的意圖。Salesforce CEO Marc Benioff 更是爆料稱,奧特曼與 Mustafa Suleyman 的關(guān)系不睦。
此外,Sora 自身在安全性上的問題遲遲未能有效解決。YouTube 曾公開指責(zé) Sora 侵犯其數(shù)據(jù)版權(quán)。雖然一番風(fēng)波中,有槍打出頭鳥的嫌疑,但是自從 Sora 代號(hào)公布以來(lái),麻煩確實(shí)不斷??偨Y(jié)成一句話:微軟想用 Sora 當(dāng)王牌拯救產(chǎn)品線,OpenAI 則礙于一系列考慮不斷推遲。
微軟這回圍繞免費(fèi)版 "Sora" 推出的一系列市場(chǎng)推廣動(dòng)作,卻讓用戶好感度驟降。比如,微軟選擇在 Bing 平臺(tái)上線 Sora 而非旗艦 AI 平臺(tái) Copilot,這是否是微軟游移不定的最佳證明?再有,Bing 上利用 Sora 視頻生成時(shí)還需要賺積分操作,生硬的推廣也讓大家 " 愣神一秒 "。
與此同時(shí),市場(chǎng)上涌現(xiàn)了如 Kling、Vidu AI、即夢(mèng)、PixVerse、WanX、谷歌 Veo、Luma 和 Runway 等一大批優(yōu)秀的 AI 視頻生成工具。Kling 早在 2.0 版本時(shí)便宣稱在物理引擎和敘事連貫性上超過(guò)了 Sora;谷歌的 Veo 系列甚至支持了高品質(zhì) AI 配樂和音效。
反觀 Sora,承諾的單次 60 秒視頻生成至今未完全兌現(xiàn),用戶實(shí)際最多只能體驗(yàn) 20 秒的輸出效果??梢哉f(shuō),如今的 Sora 雖然免費(fèi),但在技術(shù)表現(xiàn)和用戶體驗(yàn)方面已很難與競(jìng)品保持競(jìng)爭(zhēng)力。更何況,這一年中,中國(guó)廠商紛紛將成本壓到什么等級(jí),所有用戶有目共睹 。
可以說(shuō),微軟這回搞的免費(fèi)版 Sora,真的有點(diǎn)晚了。
三、中國(guó)廠商后來(lái)者居上,優(yōu)勢(shì)能保持多久?
Sora 剛問世時(shí),曾給國(guó)內(nèi) AI 視頻行業(yè)帶來(lái)了巨大壓力。如今,盡管微軟將 Sora 免費(fèi)開放,但在文本生成視頻領(lǐng)域,黃金窗口期似乎已被錯(cuò)過(guò)。不過(guò),微軟畢竟是微軟,龐大的 Windows 和 Office 用戶生態(tài),加上必應(yīng)這一強(qiáng)大的入口渠道,能迅速放大 Sora 的影響力,觸達(dá)到數(shù)量巨大的普通消費(fèi)者。
過(guò)去的一段時(shí)間中,中國(guó)的 Kling、Vidu AI、即夢(mèng)、PixVerse、WanX 等一眾產(chǎn)品已經(jīng)經(jīng)過(guò)了無(wú)數(shù)次的迭代,其中像是 Kling 等產(chǎn)品都已經(jīng)成功跑通商業(yè)化。
Sora 就像達(dá)摩克利斯之劍,一直懸在國(guó)內(nèi)外眾廠商的頭頂上。沒人知道,Sora 的到來(lái),是否會(huì)瞬間變革一切。Sora 本身的性能可以說(shuō)仍在第一梯隊(duì),其流暢性一直被人津津樂道。這回有了微軟這家 " 橫跨 PC 時(shí)代,移動(dòng)互聯(lián)時(shí)代,云計(jì)算時(shí)代,并且在每一個(gè)時(shí)代都引領(lǐng)潮頭的超級(jí)巨廠 " 在產(chǎn)品端的下場(chǎng),Sora 得到的助力將會(huì)遠(yuǎn)超以往。
" 已經(jīng)晚了 " 并不意味著沒有機(jī)會(huì)了。
可以預(yù)計(jì),微軟開放 Sora 將迫使競(jìng)爭(zhēng)對(duì)手們加速創(chuàng)新,推出更優(yōu)服務(wù)。國(guó)內(nèi) AI 視頻廠商想必都感受到了一些沖擊。之前,他們通過(guò)快速迭代,從而在 AI 視頻效果的各個(gè)領(lǐng)域積累起來(lái)的優(yōu)勢(shì),儼然無(wú)法讓大家繼續(xù)安心前行。
AI 視頻生成領(lǐng)域可以說(shuō)是一個(gè) " 強(qiáng)技術(shù)、高變動(dòng) " 的賽道,這條路有多難走,國(guó)內(nèi)大廠有話說(shuō)。比如,百度 CEO 李彥宏就曾在 2024 年第三季度內(nèi)部會(huì)上明確表示:" 百度不碰 Sora 類的視頻生成。" 他認(rèn)為 To B 業(yè)務(wù)應(yīng)盡量避免那種 " 吃力不討好 " 的定制項(xiàng)目,而應(yīng)推出標(biāo)準(zhǔn)化產(chǎn)品。
阿里巴巴通義團(tuán)隊(duì)的 AI 視頻生成模型 WanX2.1 的開源策略,也走出了一條獨(dú)特的道路,在開源的領(lǐng)域蠶食關(guān)注力。
Sora 會(huì)跑的多快?我們無(wú)法預(yù)測(cè),但是中國(guó)廠商仍需提速。過(guò)去一年,谷歌 Veo2、Veo3 在性能上的領(lǐng)先幅度非常大,但高昂的成本令市場(chǎng)反應(yīng)平淡;反而是價(jià)格適中、性能更均衡的 Kling 等產(chǎn)品大受歡迎,迅速積累了 2200 萬(wàn)用戶。
" 免費(fèi) " 策略對(duì)用戶的心理沖擊是巨大的。盡管微軟的免費(fèi)行動(dòng)更像是被動(dòng)追趕,而非主動(dòng)創(chuàng)新,但在巨頭資源的加持下,Sora 仍可能引發(fā)新一輪行業(yè)競(jìng)爭(zhēng)。
Sora 能否憑借免費(fèi)重回巔峰?國(guó)產(chǎn)廠商們還能保持多久的領(lǐng)先優(yōu)勢(shì)?或許答案并不遙遠(yuǎn)。畢竟在 AI 時(shí)代," 誰(shuí)跑得更快 " 比 " 誰(shuí)先起跑 " 更為關(guān)鍵,先行者需要不斷提速,追趕者則希望彎道超車。
本文來(lái)自微信公眾號(hào):直面 AI,作者:涯角,編輯:肖陽(yáng)