91视频观看-91视频观看免费-91视频免费网址-91视频免费网站-国产日产欧产精品精品推荐在线-国产日产欧美a级毛片

關于ZAKER 合作
虎嗅APP 昨天

MiniMax 不甘心

本文來自微信公眾號:字母榜,作者:趙晉杰,編輯:王靖,原文標題:《閆俊杰不甘心》,題圖來自:AI 生成

從 AI 六小龍縮減為 AI 四小強后,四家明星大模型創業公司終于都要上線自己的推理模型了。

在智譜 AI、月之暗面和階躍星辰相繼上線自研推理模型后,近期虎嗅爆料 MiniMax 籌備半年多的文本推理模型也即將發布。

有接近 MiniMax 的知情人士向字母榜確認了上述爆料的真實性。

字母榜曾在《無人再談 AI 六小龍》一文中率先指出,原本被冠以六小龍稱號的隊伍中,因為有人明顯掉隊(零一萬物明確放棄追逐 AGI,百川智能專注醫療垂類賽道),剩下的四家(智譜 AI、MiniMax、月之暗面和階躍星辰),也失去了如一條過江龍般,足以挑戰乃至對抗大廠的資本和技術底氣。曾經的 AI 六小龍,已經在新一輪大模型競賽中滑落成了新的 "AI 四小強 "。

曾幾何時,四小強中的 MiniMax 一度引領行業之先。2023 年下半年,大部分國內大模型廠商還在繼續迭代稠密模型(dense model)之際,MiniMax 創始人兼 CEO 閆俊杰就把 80% 以上的研發和算力資源投到了一件不確定的事情上—— MoE(Mixture of Experts 混合專家模型)。

2024 年 1 月,MiniMax 上線的 abab6,成為國內首個 MoE 大模型。此后,MoE 架構徹底取代稠密架構,成了大模型領域技術迭代的新方向,年初爆火出圈的 DeepSeek,應用的也是 MoE。

但在 DeepSeek R1 掀起的新一輪推理模型浪潮中,MiniMax 卻成了那個后來者。當騰訊等玩家紛紛靠接入 DeepSeek 賺取用戶關注之際,不甘心的 MiniMax 選擇了一種折中方案:國內 C 端應用上堅持不接入 DeepSeek,只在海外的 AI 應用上選擇接入 DeepSeek。

MiniMax 的此番操作,不免讓人聯想到字節,后者同樣選擇不在國內主力 C 端應用豆包上接入 DeepSeek,而是堅持等到后續自研推理模型的上線,才補上了深度思考的能力短板。

如今,閆俊杰也等來了一個如字節一般的機會,即嘗試通過借助自家推理模型的上線,來重新證明 MiniMax 的技術底色。

缺失推理模型的影響,正從多個方面左右著大模型玩家的發展狀態。

首當其沖的便是外界對其高估值和后續融資是否可持續的質疑。

2024 年 3 月,MiniMax 拿下 6 億美元 A 輪融資后,投后估值來到 25 億美元,這是 MiniMax 最后一次公開披露的投融資和估值信息。

2025 年年初,外界有傳聞 MiniMax 估值已經超過 30 億美元,不過,據字母榜從接近 MiniMax 知情人士處獲悉的消息,當前 MiniMax 估值已經超過 40 億美元,仍然是當前四小強中估值最高的一家,"(MiniMax)全棧技術價值更高一些。" 恒業資本管理合伙人江一如此評價道。

但遲遲未上推理模型,資本市場也開始重估 MiniMax 的估值體系。

比上線推理模型更難的是,不僅要有,作為后來者,還要做到比 R1 更好才行,"Kimi 就是一個例子,盡管跟 R1 同時期上線了 K1.5 推理模型,但效果對比上顯然敗給了 R1。" 人工智能專家林峰博士說。

這也成了拖住 MiniMax 自家推理模型未能更早上線的因素之一。在 MiniMax 前員工李俊(化名)回憶中,去年中公司就開啟了推理模型的研發工作。MiniMax 高級研究總監鐘怡然更是曾對外劇透,公司有望在 4 月到 5 月間,推出深度推理模型。

但現實的情況是,在技術迭代優化過程中,MiniMax 食言了。按照當前進度來看,樂觀情況下,MiniMax 自研推理模型也要到 6 月中旬左右上線了。

因缺失推理模型所帶來的深度思考能力短板,還使得 MiniMax 在應用側難以吸引并聚攏起更多用戶,考慮到國內應用還堅持不接入 DeepSeek,這一難題無疑被進一步放大。

對比騰訊元寶,靠著率先接入 DeepSeek 的舉動,其月活用戶一躍從去年 AI 原生 APP 陣營中的 others,變成了當前的行業 TOP3(僅次于 DeepSeek 和豆包)。

B 端的影響也在逐步顯現。因為無法提供推理模型選項,公司可能會被迫將更多模型調用需求推向對手。

因模型能力短板或性價比因素而轉投新陣營的事例比比皆是。去年 5 月 DeepSeek 掀起價格戰后,作為第一家在旗艦模型上跟進降價的玩家,字節就曾靠著性價比優勢,從 MiniMax 手中分潤走了一部分 AI 兒童玩具公司 Haivivi 的語音模型調用需求。

拖累 MiniMax 推理模型更早上線的原因,一部分要歸因于閆俊杰更大的賭性。

當 DeepSeek、Kimi 們著手研發推理模型之際,MiniMax 則將重心放在了架構創新上。" 相同的算力和資源的情況下,內部沒有太多人力去做深度推理的,這導致我們跟隨深度推理的腳步慢一點。"MiniMax 高級研究總監鐘怡然曾對外如此解釋。

早于 DeepSeek R1 發布近一周,1 月 15 日,MiniMax 發布了 MiniMax-01 并正式開源,在新模型中首次嘗試使用線性注意力架構 Linear Attention。

官方介紹,MiniMax-01 是首次在 4000 億以上參數的大模型中,使用了線性注意力機制新架構(ChatGPT 采用的標準 Transformer 是非線性注意力機制),能高效處理全球最長的 400 萬 token 上下文。

就像當年冒險賭注 MoE 一樣,閆俊杰將籌碼再次押在了 Linear Attention 上。

2024 年 4 月,MiniMax 成為第一批鉆研 Linear Attention 的 AI 公司。隨著 MiniMax-01 發布,公司內部也開始迎來新架構的更換,即從此前 abab 系列模型采用的 Transformer 架構,逐步更換為 MiniMax-01 模型采用的線性架構,后續視頻、音樂等多模態模型更新,都將基于全新架構。

這也是 MiniMax 內部沒有選擇立馬跟進 OpenAI o1 的原因之一。" 我們認為單純強調推理能力,可能僅會在某些特定方面增強模型性能。" 鐘怡然解釋說。

然而,R1 的發布,給了 MiniMax 一個措手不及," 我們發現融入這些推理能力,模型的外推能力顯著提升,泛化能力更好。" 為了追趕行業新態勢,鐘怡然所在的模型研發團隊,整個春節期間都在趕工,以圖加快推理模型上線。" 內部給出的目標是,要做出比 R1 更好、甚至要達到 o1 或 o3 相近水準的推理模型,且實現多模態推理能力。"

不甘心的閆俊杰決定再次冒險:試圖趕在 DeepSeek 前面,推出一個原生多模態深度推理模型,既能實現文本推理能力,又具備視覺理解能力。

但在虎嗅爆料中,MiniMax 即將發布的推理模型則只具備文本理解能力。后續是否會加入視覺理解,還是分階段逐步推出,目前仍留有懸念。

除了因冒險押注新架構帶來的資源分散之外,在應用上的豪賭布局,也分散了 MiniMax 追求模型迭代的精力。

AI 六小龍中,MiniMax 布局幾乎最廣:既做 To C,又做 to B;既做國內,又做海外。龐大的業務策略,帶來的代價之一便是產品和模型團隊之間的 " 打架 "。

MiniMax 前員工李俊告訴字母榜,2024 年,公司將收入和產品日活視為兩大重要指標,甚至會出現這月追求收入,下月強調用戶增長的頻繁變動情況。

從 2023 年開始,圍繞娛樂和生產力工具賽道,MiniMax 一個都不打算放過:Talkie、星野、海螺 AI 相繼問世,堪比 AI 圈的新 APP 工廠。

為了打造產品,閆俊杰還特意挖來前今日頭條用戶產品負責人張前川,給其賦予了公司合伙人的身份。

但豪賭一年后,閆俊杰為公司設立的 2024 年收入過億美元和產品日活過千萬兩大目標,均未能實現。這也成為公司后續人員變動和組織架構調整的新導火索。

今年 3 月份,MiniMax 負責商業化的合伙人兼副總裁魏偉離職,更早之前,從去年 9 月份開始,MiniMax 產品負責人張前川,便淡出公司事務,改任產品顧問一職。

兩大合伙人相繼變動之下,MiniMax 在應用側也改變了策略:旗下 AI 應用 " 海螺 AI" 一分為二,拆分為一個主打 AI 助手的 "MiniMax",和側重視頻創作的 " 海螺 AI"。

幾次豪賭過后,閆俊杰吸取到的最大教訓之一是,對技術品牌沒有很深的認知。在 2023 年初認識梁文鋒后,后者有兩件事對閆俊杰一直帶來啟發:一是 DeepSeek 品牌做得非常好;另一個是 DeepSeek 一開始沒有產品,所以更聚焦。

DeepSeek 爆火并在短短時間內成為國內月活第一 AI 原生 APP 后,閆俊杰糾正了自己過去兩年來的一個誤區:即認為用戶越多,模型能力提升越快。實際則是 " 更好的模型可以導向更好的應用,但更好的應用和更多用戶并不會導向更好的模型。"

基于這一新的判斷,閆俊杰重新做了取舍,不再將用戶規模和商業化視作重點,而是重新將技術迭代確立為 MiniMax 的最重要目標。

但新的挑戰接踵而至。

當下大模型賽道正進入淘汰賽,資金持續承壓已成為行業現實。恒業資本管理合伙人江一爆料稱,魏偉的離職原因之一,是因為融資 KPI 考核未達標。

但被融資困住的不只有 MiniMax。" 本質上是市夢率的時代在短短兩年內已經結束。現在面臨的是融資放緩 + 收入壓力 + 戰略調整的新階段。" 在江一看來,外界對大模型公司的考核標準,正從交付 MaaS 變成交付結果,競爭焦點也從過去比參數大小、多模態能力,偏向現在比誰能真正解決用戶問題。

" 最后市場狀態,基礎模型市場上正常情況下應該不超過三家。" 怎么能確保繼續留在這場大模型牌桌之上,持續獲取融資的能力便成了決定勝負的關鍵手。

畢竟,無論是更新迭代模型能力,還是打造能夠解決用戶真實需求的 Agent,無一例外都需要人才和算力資源的支撐,這些要素都得靠源源不斷的金錢來維系運轉。

稍有松懈,這些大模型廠商就可能面臨被迫落后的局面:要么核心研發人員出走創業,要么在重要技術迭代方向上慢人一步。

即便解決好內部人才和資源問題,但隨著 DeepSeek 重新激起大廠的 AI 熱情,如 MiniMax 一般的初創公司,該如何在競爭中繼續做出自己的技術亮點并保持領先地位,正變得越來越難。

MiniMax 當前正寄望于用新的原生多模態推理模型重回舞臺中央,但在這一領域,字節、阿里,騰訊,提前一步已經在文本推理模型之外,上線了圖像推理模型:3 月份,阿里通義千問團隊推出 QVQ-Max 視覺推理模型;4 月份,豆包深度思考模型專門打造了視覺版,具備視覺推理能力;5 月份,騰訊混元 T1-Vision 上線元寶,可深度理解圖片內容。

更大的競爭還在后面。延期后的 MiniMax 推理模型,即將直面 DeepSeek R2 和 GPT-5 的競爭,后兩者都有望在今年下半年上線。

近期在墨西哥舉辦的 AI Summit 上,OpenAI 代表確認正在開發下一代基礎模型 GPT-5,并有望年內上線。

DeepSeek R2 的推出步伐也越來越近。按照 DeepSeek 以往內部模型每 7 個月一更新的節奏,新一代 V4 模型有望在今年 7 月份亮相。如果梁文鋒希望在 V4 版本上訓練 R2,以 R1 與 V3 相隔 1 個月的推出時間差評估,R2 最快便有望在 8 月份上線。

對于想要繼續留在牌桌上的閆俊杰而言,這場 AI 大模型的競爭還遠沒到盡頭。

參考資料:

《MiniMax 正暗戳戳憋大招》虎嗅

《奧特曼逼梁文鋒出大招》直面 AI

《晚點對話 MiniMax 閆俊杰:創業沒有天選之子》晚點對話

《3700 次預訓練尋找 " 線性注意力 " 非共識,MiniMax-01 開發者講述 4 年探索》晚點 LatePost

《MiniMax-01 開源:新架構開啟 Agent 時代》MiniMax 稀宇科技

《MiniMax:7000 萬美金營收下的甜蜜和隱憂》智能涌現

《MiniMax 大模型每日與世界的 30 億次交互》MiniMax 稀宇科技

本文來自微信公眾號:字母榜,作者:趙晉杰,編輯:王靖

相關標簽
主站蜘蛛池模板: 一区二区三区在线观看视频 | 交视频在线观看国产网站 | 亚洲国产成人久久综合一区 | 18视频免费网站 | 亚洲撸| 欧美久久视频 | 一区二区不卡在线 | 国产精品拍拍拍福利在线观看 | a级片在线免费观看 | 欧美人成毛片在线播放 | 毛片日韩 | 欧美日本一区二区三区道 | 欧美一级手机免费观看片 | 一级毛片在线免费观看 | 亚洲欧美在线不卡 | 亚洲精品一区二区三区第四页 | jiucao在线观看精品 | 日韩一区二区三区不卡视频 | 草久久久久| 午夜影院福利社 | 国产67194| 午夜宅男在线永久免费观看网 | 亚洲免费天堂 | 日韩高清在线二区 | 国产九九精品视频 | 老司机亚洲精品 | 国产在线精品香蕉综合网一区 | 美女精品永久福利在线 | 黄色一级毛片免费 | 日韩午夜视频在线观看 | 免费观看一级特黄欧美大片 | 日韩黄色在线 | 久久中文字幕久久久久 | 亚洲综合一区二区精品久久 | 亚洲欧美成人在线 | 精品国产亚洲人成在线 | 欧美一级毛片在线播放 | 国产成人久久久精品一区二区三区 | 三级网址免费 | 日韩国产免费 | 亚洲最大激情中文字幕 |