?
努比亞 M153的三萬臺還沒有賣光,豆包的手機端合作版圖,有望進一步擴大。
近日,界面新聞報道稱,字節跳動正推進與 vivo、聯想、傳音等硬件廠商開展 AI 手機合作,為其設備預裝 AIGC 插件;多位 vivo 員工向媒體證實雙方已確認合作、正在討論細節。
不過,僅憑這條消息模糊的表述,尚無法確認這些“合作”的具體性質,是否和此前字節與中興的合作方案劃等號。此前,在 nubia M153上,字節在手機 OS 層深度構建了 GUI Agent,可以自動接管用戶指定的跨 App 操作,但隨后遭受了來自微信、淘寶等 App 的“反制”。
但從最新合作傳聞中不難看出,M153的嘗試還是吸引了手機行業的目光。隨著字節帶著豆包大模型能力入局,終端廠商的原生 AI 生態正在加速擴張。
這一趨勢,在近日舉辦的火山引擎 FORCE 原動力大會上可以窺探一斑。
包括中興、榮耀、小米、vivo 在內的多家手機廠商為火山引擎“站臺”。不過,除 nubia 帶來的 M153之外,大部分手機廠商和豆包的關系更多是模型能力的調用,Agent 層面的產品形態、交互方式以及系統級整合,依然主要由手機廠商主導。
在本屆源動力大會的群訪環節,火山引擎總裁譚待在接受直面 AI 采訪時表示,“AI 的價值在于用更方便、更便利的方式,做大用戶的需求”。
顯然,不管后續字節和這些廠商的合作如何展開,一個行業趨勢已經愈發清晰。系統層的 Agent 潛力巨大,即便當前落地存在一些阻力,但在 M153上已經能看到未來的雛形。
不管是合作還是自研,大模型廠商和手機廠商們,已經喊著“做大做強”的口號,加速涌入這一賽道。
A
手機廠商們加速擁抱字節等大模型廠商,背后是手機端原生助手領域,有著天然體量巨大的活躍用戶基礎。
QuestMobile 的2025年三季度報告顯示,截至2025年9月,移動端 AI 應用 MAU 達到7.29億;其中“手機廠商 AI 助手”規模約5.35億,“原生 AI App”約2.87億,“In-App AI”約7.06億。
換言之,在原生 AI 的不同形態里,終端和 App 有著明顯的用戶“層級差”:原生 AI App 依賴用戶主動點擊觸發,而系統級助手天然就在“隨手就用”的前置位,甚至無需用戶刻意點擊就能維持日活。
事實上,圍繞“如何在系統層喚起 AI、如何讓助手不只停留在語音問答”的探索,幾乎已經成為國內主流手機廠商的共識,只是受限于模型能力與工程穩定性,多數方案最終停留在“增強版語音助手”的階段,而豆包手機助手的出現直接踢開了這扇大門。
盡管nubia M153呈現的效果在業內仍有爭議,但豆包手機助手在 OS 層獲得授權后,實現了自動接管用戶的跨應用任務,讓業內看到了完全體 GUI Agent 的雛形。這一形態帶來的想象力空間,并不會隨著部分超級 App 的“反制”而消失。
另一方面,隨著近兩年大模型在指令理解、多輪規劃與工具調用能力上的明顯躍遷,AI 首次具備了承擔復雜任務鏈的可能;與此同時,移動端算力、內存與本地推理能力的持續提升,也讓“端側執行”不再只是概念。
手機端“可跑得動”的關鍵之一,是移動 SoC 的 NPU 峰值算力與能效在近兩代出現躍升。根據行業調研機構 Counterpoint 的分析,2025年全球主流旗艦級 SoC 幾乎全面支持生成式 AI,本年度出貨的高端 SoC 中有約88% 已具備生成式 AI 能力,且這些芯片的 AI 算力峰值在2025年已經接近100TOPS級別,約為2021年水平的四倍。
AI登“機”的浪潮下,Siri 時代那種以固定指令為主的語音助手邏輯,已經難以滿足用戶對“智能”的期待。
在這樣的窗口期下,手機廠商迫切需要在硬件與系統層面,尋找新的體驗突破口;而 AI 云廠商,則擁有更成熟的模型與工程能力。雙方的靠攏,并非一次偶然的商業試探,而是技術成熟度與產業需求疊加后的結果。
這也是為什么,盡管 M153的銷量規模有限,但3萬臺工程機,仍像是一枚信號彈,給早已蠢蠢欲動的手機行業一個沖鋒的信號。
這樣的背景下,市場開始傳出 vivo 等體量更大的廠商,與字節推進合作的消息,其實合情合理。這并不意味著所有廠商都會復制 M153的深度定制模式。vivo 此前就發布過“藍心智能”AI 戰略與自研藍心大模型矩陣,并強調 OriginOS 與系統級智能體能力的升級。
另一邊,以榮耀為例,YOYO Agent 已接入豆包大模型的部分能力,但 Agent 的訓練、產品邏輯與系統整合,依然由榮耀主導完成。這種“能力接入而非產品外包”的方式,或許才是更多手機廠商在當前階段的現實選擇。
值得關注的是,榮耀首席影像工程師羅巍,此前曾就豆包手機助手發表個人觀點:“因為字節沒有硬件研發能力,或者硬件能力并不比中興領先。那么就是兩個矮子在一起,也不會生個高子。”
但在這番評價之后,榮耀的展臺仍然作為火山引擎合作伙伴,出現在了本屆原動力大會上。
回過頭看,字節的這次激進,并不是脫離產業節奏的冒進,而是踩在一個已經逐漸成熟的窗口期上。M153的意義,也并不在于證明某一款產品的成功,而在于讓行業更堅定地看到:端側Agent,已經成為一條無法回避的路徑。
而面對微信和淘寶等App不斷筑高的城墻,App與Agent的關系,成了繞不開的下一問。
B
豆包手機助手面世以來,在業內迅速引發了一些討論:當 AI 可以直接理解意圖并代為操作,Agent 是傳統 App 的威脅嗎?
在本屆火山引擎原動力大會的群訪環節,譚待回應了直面AI提出的這一問題,他首先從用戶視角進行了闡述。
“假如說用戶想點一杯咖啡,點咖啡這個操作不管是通過跟機器人語音交互,還是操作手機完成,最后都是為了滿足用戶的需求。”在他看來,普通人還有很多需求沒有被滿足,通過 AI 可以更好地解決這些問題。
“至于這個 AI 的載體是 Web、App、agent,還是套了個 App 殼的 agent,可能沒有那么大關系。”譚待這樣說道。
所以,回到手機原生助手層面,能操作多少 App 也許從來不是問題的核心,真正重要的,是 AI 是否能用更低的使用成本,把原本未被滿足的需求釋放出來。當需求被“做大”,無疑在硬件層面可以建立起全新的用戶心智,尤其是廣大用戶對 AI 已經并不陌生的2025年。
QuestMobile 數據顯示,截至2025年第一季度,原生 AI 應用的月活躍用戶規模大幅擴容,其中用戶對 AI 原生應用從“嘗鮮”逐漸轉向“依賴”,其人均月使用次數同比增速明顯高于使用時長增速。
報告顯示,AI 原生應用的月人均使用次數同比增長約53.1%,而月人均使用時長則增長約32.7%,用戶層面傾向于多次短時打開 AI 應用去完成即時類需求。
這些需求,正是手機原生 Agent 可以放大的那部分。但這本質上是一個增量邏輯,并不意味著 App 的價值短期內會被快速削弱。
中國信通院在2024年發布的數字應用生態報告指出,用戶使用時長仍高度集中在少數頭部 App 上,支付、即時通訊、短視頻等核心應用合計占據超過八成的用戶總使用時長。這些 App 所承載的賬戶體系、支付能力、內容供給與安全責任,短期內都不具備被 Agent 直接替代的條件。
也就是說,Agent 正在改變 App 的“入口位置”,而非消解其存在價值。
在這一結構中,App 仍然是能力與服務的封裝體,但不再必然是用戶表達需求的起點;Agent 則逐漸承擔起“需求調度層”的角色,負責理解意圖、拆解任務,并將執行分發給不同應用或系統能力。
甚至,用戶驅動 Agent 的終端甚至未必是手機。
根據 Counterpoint Research 的追蹤與分析數據,2025年智能可穿戴設備市場中 AI 智能眼鏡等具備本地 AI 能力的終端表現出顯著增長勢頭。2025年上半年,全球智能眼鏡出貨量同比增長超過110%,其中 AI 型智能眼鏡的出貨占比大幅提升,反映出業界對本地 AI 能力的快速采納趨勢。
而在這一背景下,字節也不會是唯一入場的大模型廠商。
智譜 AI 在近期將其核心 AI Agent 模型 AutoGLM 開源,使研究者與開發者能夠基于該模型構建具備“Phone Use”能力的 AI 終端智能體。
AutoGLM 能夠理解屏幕內容,并通過模擬用戶操作(如點擊、滑動、文字輸入等)完成多步驟任務流程,目前已在微信、淘寶、抖音、美團等超過50個高頻中文應用場景中展示出自動化操作的能力。
換言之,當更多大模型廠商試圖“上機”,分水嶺就不再只是模型接入,而是手機廠商是否愿意把系統層的 AI 入口與規則讓渡出去。下一階段的競爭,更像是“系統與生態”的較量。
C
如果說 nubia M153更像是一種“工程驗證”,那么在它發布數周后,小米在人車家全生態大會上同步披露的澎湃 OS 與 AI 進展,則代表著傳統手機豪強的同步跟進。
在這場大會上,小米并未將重心放在單一模型或功能上,而是反復強調澎湃 OS 作為系統級底座的角色——它正在成為連接手機、平板、電視等多終端的統一操作系統框架,也是 AI 能力被組織、分發與約束的核心層級。
這一判斷,并非停留在概念層面。根據小米官方披露的數據,截至2024年底,小米 AIoT 平臺已連接設備數超過8.2億臺,覆蓋手機、平板、電視、穿戴與家居等多個品類。澎湃 OS 的目標,正是將這些分散設備納入統一系統框架之中,使 AI 能力可以在不同終端間被調度與復用,而非依附于單一應用。
這意味著,在小米選擇把 AI 能力牢牢放在操作系統內部,而且這個系統對應的硬件生態同樣龐大。
另一邊,作為小米 MiMo 大模型相關負責人,羅福莉在本次大會上首次公開亮相。在談及 AI 能力演進方向時,她將重點放在任務理解與執行層面,強調 AI 需要具備對復雜需求進行拆解、規劃并與系統能力協同完成的能力,而不僅停留在單輪問答或信息生成階段。
從產業結構看,這條路線與字節所代表的 AI 云廠商路徑形成了對照。
頭部 AI 廠商希望進入手機 Agent 市場,邏輯并不復雜,是因為手機仍是用戶最重要、最穩定的高頻入口之一;但對手機廠商而言,操作系統、硬件整合與生態控制力,才是其長期優勢所在。一旦 Agent 深度嵌入系統層,誰來定義交互方式、權限邊界與默認入口,決定了最終的主導權。
這也是為什么,多數頭部手機廠商在接入外部模型能力的同時,仍堅持自研 Agent 框架與系統級助手。它們更傾向于把云廠商視為能力提供者,而非產品定義者。
事實上,這并非一條新出現的路徑。更早之前,華為在推進 HarmonyOS 與小藝助手的過程中,已經持續強化系統級調度與跨設備協同能力,并將 AI 能力作為操作系統的一部分加以演進。
根據華為在2024年開發者大會上的公開數據,HarmonyOS 生態已覆蓋8億+ 設備,注冊開發者超過220萬,并運行在手機、平板、穿戴、車機及各類 IoT 終端之上。在這一體系中,小藝并非獨立應用,而是深度參與系統級調度與跨設備協同,用于統一調用多終端能力。
而在智能眼鏡、耳機等新硬件形態上,這種生態差異被進一步放大。對屏幕受限、操作碎片化的設備而言,Agent 更接近“基礎交互層”,而品牌與系統協同能力,往往比單一模型能力更重要。
在這一點上,顯然傳統硬件廠商的優勢會更大,但AI廠商們,如字節和阿里也在推進各自的AI硬件業務,小藝與超級小愛,是否能夠在端側體驗上全面超越豆包,目前仍難下定論。
但近期手機圈對于豆包和其他AI的“加碼”已經清楚表明,無論是 AI 廠商還是手機廠商,都已將目光投向 AI 手機這一仍待開墾的系統級空間。
在豆包手機助手的“信號彈”作用下,2026年,AI手機有可能迎來“做大做強”的一年。
發布時間:2026-01-01 18:01