2026
04/15
14:48:54
分享
中国手机AI下半场,拼的是"眼力"

  让手机“看懂”你身边的世界。

  文 | 华商韬略 方乐迪

  如果把过去两年的智能手机市场比作一场牌局,那么“算力”无疑是各家争相打出的明牌。从百亿参数大模型塞进手机,到各类 AI Agent 轮番上阵,但算力足够强,模型足够大,就能在这场AI盛宴中分得最大的蛋糕吗?

  当大模型逐渐沦为标配,或许战场已经悄然发生转移。

  在今年的博鳌亚洲论坛上,vivo 总裁胡柏山在台上说了一句话,我觉得算是把这层窗户纸捅破了:“算力终将普及化,感知才是护城河。”

  其实,胡柏山是在提醒:算力早晚会变成像水和电一样便宜的通货,谁都能买得到;但怎么让手机真正看懂眼前这个世界,这活儿别人替你干不了,也买不来。

  ▲vivo 总裁、首席运营官兼中央研究院院长胡柏山 图源:vivo

  【01 感知护城河,重构AI时代的旗舰准心】

  今天的AI确实已经足够聪明。它能写代码、能做报表、能根据指令生成视频、图片……但这些能力的共同点在于,它们处理的都是已经被数字化、结构化的信息。一旦面对真实、混沌的物理世界,AI往往会显得笨拙,甚至“失明”。

  正如胡柏山所言:“没有感知能力,AI就像是困在黑屋子里的大师,算力再强,也看不见咫尺之外的世界。”

  我认为,这才是当前手机厂商最有机会建立核心壁垒的地方。

  人类 60% 到 70%的感知来自视觉,手机也是一样。当算力和模型能力逐渐同质化、开源速度越来越快时,谁能让设备真正“看懂并理解”物理世界,谁就能在AI的下半场占据主动。胡柏山甚至拿特斯拉 FSD 做了个绝妙的类比:模型有可能被追上,但海量真实的场景数据才是真正的护城河。

  对于手机而言,影像就是这条护城河最核心的入口。过去十年,手机厂商在影像上的叙事框架一直停留在“拍出更好的照片”,但vivo现在想改变这个目的地——把影像从“记录工具”升级为“感知系统”。感知系统做的事情不是“拍下来”,而是“读明白”:读懂光影,读懂空间,读懂场景里发生了什么,甚至读懂人的情绪状态。

  很多人可能会问:镜头作为入口,除了拍照,在手机里到底还能干什么?

  这其实是一条“镜头捕捉→AI读懂→理解场景→主动服务”的完整逻辑链。以即将发布的 vivo X300 Ultra 为例,这款被定位为“专业 V 单”的旗舰,不仅搭载了全球首发的蓝图×索尼 LYTIA-901 传感器(1/1.12 英寸超大底、35mm 2 亿像素主摄),还配备了2亿像素的三星 HPB 潜望长焦镜头,以及支持等效 400mm 直出2亿像素的蔡司外挂增距镜。

  在vivo的战略构想中,顶级的影像硬件正是AI获取高质量、高保真物理数据的关键窗口。当这双“眼睛”足够锐利时,AI就能在真实场景中大显身手。

  比如在 X300 Ultra 上首发的“相机 Agent”,彻底改变了过去用户需要手动切换人像、微距、长焦模式的痛点。相机会根据拍摄对象的光线、距离、类型,自动识别场景,弹出它认为最合适的成像建议,甚至预判拍摄对象的运动轨迹。

  这绝不是“拍照辅助”,而是相机自己在“理解”场景。

  再比如,失明九年的用户宝哥,去年带着导盲犬,靠一台vivo手机环游中国。在南澳的渔船上,手机摄像头并没有在“拍照”,而是在持续“看”——通过“vivo 看见”功能,AI实时语音描述眼前的场景,告诉他:“面前是你的朋友章喜德,他双臂交叉,面带微笑,穿着一件深色长袖。”

  这才是真正的“看见”与“感知”。

  更关键的是软硬结合的壁垒。vivo做了快十年的影像大模型算法,其模组是针对这套算法定制做过硬件开发的。正如胡柏山所言:“硬件上的镜头、模组、马达,容易被复制;但算法与认知强相关,对手很难快速跟上。”

  从 Smart Phone 到 Agent Phone,从“拍照工具”到“感知入口”,vivo正在把过去十年在影像赛道上的深厚积累,转化为AI时代最坚实的底座。

  【02 全场景开拓,感知能力的跨界泛化与跨界】

  如果说影像技术是vivo构建“感知护城河”的基石,那么这种感知能力的跨界泛化,则展现了其作为一家科技平台的野心。

  在产品形态的拓展上,vivo坚持“少押注,押重注”的务实逻辑,将手机端积累的深厚影像算法与感知能力平移至新赛道。

  首先是手持影像设备。据披露,vivo已于2025年底立项了一款对标大疆 Pocket 系列的Vlog运动相机,预计2026年上市。

  这一跨界并非心血来潮。过去几年,国产手机厂商在索尼一英寸传感器上砸下了数以亿计的研发费用,从色彩科学到 HDR 动态范围,从极限夜景的噪点控制到 Log 视频工作流,积累之深甚至不亚于专业相机厂商。vivo自研的蓝图 V3+影像芯片具备 4K 60fps 人像视频处理能力,X50 时代尝试将微型机械云台塞入手机所积累的防抖结构数据至今仍在发挥价值,再加上较早打通的 ACES 工业级色彩编码体系——把这些能力从手机里剥离出来,装进一台专注影像的手持设备,技术上几乎是水到渠成的事。而手机厂商天然具备的生态协同能力——素材通过私有协议回传手机、调用端侧AI模型辅助剪辑——则为这类产品提供了独立相机品牌难以复制的使用体验闭环。

▲图源:每日经济新闻

  其次是家庭机器人领域。2025年,vivo正式成立机器人 Lab,成员横跨无人机、计算机视觉、机械工程等多个领域。

  那些一上来就追求“大而全”的公司不同,vivo的切入点显得非常接地气——从“看懂”并喂好宠物、叠衣服等具体场景开始。胡柏山的逻辑很清晰:机器人是vivo感知生态的自然延伸。先把室内环境的三维重建、动态障碍物识别等单一任务做到 60-70 分,积累足够的数据后,再一代一代泛化。这种从具体物理场景出发,逐步实现感知能力向机器人迁移的务实路径,展现了vivo对具身智能的深刻理解。

  除了新形态产品的布局,vivo 在生态融合上的“破壁”同样令人瞩目。以商务折叠旗舰 X Fold5 为例,它在安卓阵营中首创了与 Apple 生态的深度互通。这不仅仅是简单的蓝牙配对,而是原生级的底层打通:不仅支持 AirPods 的空间音频和手势操控,还能实现与 Apple Watch、iPhone 的双向通知流转;在PC端,X Fold5 甚至能变身 Mac 的扩展显示屏,支持任务接力和键鼠协同。

  这种打破生态藩篱的开放姿态,直击多设备办公商务用户的痛点,不仅为折叠屏找到了新的增长逻辑,更体现了vivo在全场景协作中的技术自信。

  从手机到运动相机,从家庭机器人到跨生态互联,vivo展现出的不再仅仅是一家传统手机厂商的形象,而是一个正在多点布局、具备全场景感知能力的科技生态平台。

  【03 价值本位,以技术溢价对冲成本风暴】

  通往未来的道路并非坦途。

  2026年,全球智能手机行业正面临一场前所未有的供应链成本风暴。

  据权威市场调研机构集邦咨询数据显示,受全球供需失衡影响,2026年 DRAM内存及NAND闪存价格爆发式上涨,部分核心存储产品环比涨幅超130%。

  这种成本的暴涨,让许多手机厂商陷入了“不涨价就亏本,涨价就掉销量”的尴尬境地。

  面对困局,vivo展现出了极强的战略定力。2026年3月16日,vivo官方发布公告,宣布自3月18日起调整部分产品的建议零售价。

  在行业内卷加剧的背景下,官宣涨价无疑需要巨大的勇气。但vivo的选择是:拒绝低价内卷与降配保价,坚守“技术含量”与“用户体验”的价值本位。

  消费者并不排斥高价,他们排斥的是“德不配位”。因此,vivo并没有通过牺牲配置来维持表面的低价,而是通过技术升级来确保产品价值。每一分价格的上浮,都对应着感知能力的跨代飞跃。无论是 X300 Ultra 上那颗震撼的400mm 终极长焦,还是 X Fold5 上打破壁垒的跨生态互通能力,都是 vivo以技术价值对冲成本压力的底气所在。

  说到底,对普通用户来说,真正值得关心的只有一件事:手机这个每天陪你十几个小时的东西,到底在变得更好用,还是只是在变贵?

  vivo这一轮的回答,至少方向是对的——把钱花在让手机“看懂”你身边的世界上,花在让它能跟你手头所有设备无缝协作上,花在让一个失明用户也能通过它“看见”朋友的笑脸上。如果这些能力真的一步步兑现,那手机这个品类远没有到天花板。

  在一个人人都在抢着讲AI故事的年份里,vivo选择先把“看”这件事做扎实,再一步步往外走。这条路未必最快,但对用户来说,走得稳比跑得快重要得多。

  在这个充满焦虑与不确定性的AI时代,vivo正在用一套“感知+价值”的组合拳,交出一份利在最长远的答卷。

华商韬略
市值观察号
客服号
联系我们
地址:
北京市朝阳区甘露园南里25号国际创展中心20层 2006-2008
电话:
010-8559 2899
传真:
010-8559 2799
邮箱:
hsmrt@hsmrt.com
华商韬略(北京)国际文化传媒中心
版权所有 违权必究
京ICP备07007063号-2 京公网安备11010502020639