撰文 | 李信马
题图 | 百度AI开发者大会
熟悉百度的朋友们应该知道,就像阿里巴巴喜欢用动物来命名旗下的产品业务,百度在产品命名上对“一”字情有独钟。
这个规律可以追溯到2005年启用的经典品牌广告语“百度一下”,近期让人熟悉的是大模型“文心一言”,其实同期还有“文心一格”,不过逐渐不被提起了。刚刚过去的百度Create AI开发者大会上,百度“一族”又添了一位新成员——百度一镜。
这个名字取得很不错,让人第一反应就是“一镜到底”,猜测和视频生成相关。实际也是如此,百度一镜是由原数字人品牌“慧播星”升级而来的全场景数字人平台,品牌寓意“一镜到底、一镜生成”。
2023年5月,百度慧播星平台于建站,不过其第一次“出圈”要一直到2025年6月,百度与罗永浩合作推出超头主播数字人,直播首秀吸引了超过1300万的观看人次。其实这里有个很有意思的点,百度集团副总裁平晓黎在2023年担任百度电商总经理,数字人项目隶属于百度电商事业部(百度优选),早期立项是为了弥补百度在直播生态上的短板,实际上对电商业务也的确起到了带动的作用。
但做电商和做AI技术输出这两件事,长期来看哪件对百度来说增长空间更大呢?笔者认为是后者,国内的电商市场虽大,可阿里、京东、拼多多鏖战不休,直播电商还有抖音、小红书等后起之秀,与其说“红海”倒不如说是“血海”了。
而AI技术带来的是增量市场,2025年,百度数字人业务有超过10万客户和合作伙伴,开播规模同比增长202%,收入同比增长228%。据平晓黎不久前在采访中透露,其年收入已经达到了“几十亿”。“财报里,百度有一个AI总体收入,那里面有我们数字人的部分,占了一个挺大的比例。”
随着技术不断进步,落地场景不停地开拓,市场空间也会随之与日俱增。打个比方,就像“老干妈”陶华碧最早是卖凉粉的,但辣椒酱因为味道独特,反而后来成为了主打产品。标题中,笔者用了“出圈”这个词,实际上,这个圈最初可能是百度电商生态,然后可能是中国电商市场,再之后是全球电商市场,这是一种期待——它能否不断地“脱颖而出”呢?
在过去三年,笔者也观察到,数字人业务在技术水平、业务范围和百度集团内部战略位置上不断加码。2025年11月,慧播星发布了“实时互动型数字人”;本届大会上,慧播星升级为百度一镜,并集数字人直播、数字人视频、实时互动数字人功能于一体,相比最初,能力范围可以说极大地拓展,百度创始人李彦宏当天在演讲中,有点夸张地评价:“一个人加一镜,就可以完成任何视频创作,这是超级个体的创作革命。”
01、百度一镜能做什么?
前面讲到,百度数字人从诞生之初就是服务业务的,所以这部分主要谈具体能做什么。
百度在去年的Create大会上推出了高说服力数字人,百度数字人创新业务部、电商商业业务部负责人吴晨霞在采访中表示:“能够比拟真人,甚至超过真人的,基本只有我们一家。”咨询机构沙利文在《中国AI数字人产业发展报告,2025年》中也将百度一镜列为数字人市场份额和产品综合实力的双料第一。
升级后,百度一镜的定位是全场景多智能体数字人平台,技术上,百度一镜主要是依托文心大模型、数字人专精模型、多智能体协同系统,基本上是通过调用多个模型针对具体的场景来综合完成端到端任务。
平晓黎在采访中进行了具体的解释:“百度一镜先使用多智能体的技术形态,通过AI大脑把任务进行拆解、分解、规划。比如说在创作直播、视频的任务下,我们会先结合用户的需求有一个创意的思考;如果是电商的任务,会思考商品有哪些卖点;如果是内容创作,可能要结合热点,先把这个主题进行剧本的规划。
短视频可能要有它的剧目、分镜、台词,直播可能以台词为主,加互动为辅,这样先通过调用语言模型来形成剧本,然后根据这个剧本的任务再完成下一步的生成。比如说在视频的过程中要生成分镜,每个分镜可能再去调用视频的模型,生成一些首帧和片段,里面加入我们强参考的能力和对智能体的把控,如何使用这个模型来完成这个任务,最后再进行剪辑。”
目前市面上常见的产品是模型即应用,或者说模型直出,它们和百度一镜的不同在于:
第一,如果模型即应用,比较受限模型的能力,多数只能生成15秒以内的一个任务;
第二,用户必须自己把子任务描述得非常清楚,不能模糊地完成一个端到端的任务,模型本身不能进行更复杂任务的拆解,所以用户需要使用非常多的模型,自己完成这个编排和规划。
“我们的产品是希望帮助用户场景全流程做这件事,实际上我们希望可以帮助他成为一个‘超级个体’,通过智能体的加持帮他完成整个的生产过程。”
但说到底,AI主播像不像真人,有没有“活人感”,是一件非常重要的事情,吴晨霞就提到,海外直播间有时主播一旦被看出来是“AI”,整个直播间全是负评。所以,百度一镜能做什么,可能是产品设计层面的问题;能做到什么程度,核心还是看底层技术的水平。
02、下一场的出圈是出海
出海总是让人心潮澎湃的,而且风是顺风,鱼是贵鱼。
在平晓黎看来,海外市场有高付费意愿和成熟的市场机制,还和国内市场存在着一致的趋势:AI工具在加速渗透。原因很简单:“痛点是相近的,真人去制作内容的成本非常高,无论是视频拍摄的成本,还有直播间开播的成本。”其次,大模型技术的发展不是线性的,而是阶梯型往上走,效果越来越好,使得应用的普及性被大幅推进。
今年下半年,百度一镜表示重点会先做电商场景,把电商场景上的优势打磨好。而在电商场景上,百度一镜计划先服务好中国出海的电商商家,重点深耕东南亚、拉美、北美、欧洲四大区域。虽然这样讲有点黑色幽默,但在海外想要像在国内这样找到大量经验丰富而且愿意三班倒的直播主播可不容易,AI主播就有现实的替代价值。
“我们希望中国出海的电商商家都能够用到百度一镜海外版的电商视频带货能力,因为我们是端到端的,(知道)他们用20个工具来回搓,搓出一条视频来也很痛苦。此外,我们本身也在做品牌营销场景和短漫剧场景的探索。”平晓黎说。
据介绍,百度一镜海外版核心能力由剧本Agent、视频Agent、智能剪辑Agent三大智能体协同构成,支持12种主流语言、母语级口型匹配、本土化Agent智能创作,覆盖了TikTok、Shopee、Lazada、阿里国际站等全球主流平台。“视频我们主要以欧美、北美为主,直播我们跟TikTok现在基本在东南亚完全跑通了,然后在欧洲和南美一些小国家也开始开了。欧美的视频用户付费意愿比较强,东南亚主要需要的是剪辑能力,如果纯走生成,以现在大模型的成本他们不太能买得起。” 吴晨霞说。
当天有两个有趣的展示,一个是在电商带货场景,帕梅拉蛋白能量棒的带货视频,剧情不评价,但在试吃、场景切换中保持了较高的人物与商品一致性,仅此足够用于商业化实践了。
还有在品牌营销场景的可口可乐世界杯限定版TVC,据介绍从创意洞察到分镜设计、运镜调度、剪辑节奏全部由AI完成,5个人物5个城市风格一致。吴晨霞在采访中透露:“整体制作周期,包括从一开始brief的确认、分幕的确认,到最后视频的确认,相对来讲比它自己线下找一个公司去做,节省的时间至少是一半以上,甚至比(原来的)三分之一都少。然后可口可乐也比较满意,我们这个片子做出来之后,因为它有些别的场景,又追了好几个小片让我们做。”
在百度一镜的规划中,今年会是海外数字人直播的元年,完成打开局面到开始规范的迈进,并在未来三年迎来爆发式的增长。对于更遥远的未来,平晓黎认为:“当实时互动技术进一步提升,数字生命进一步成熟,它在toC的场景上也有非常大的机会和想象空间。我的看法是,随着AI技术进一步发展,会发展出人和AI的关系,数字人会是非常好的人和AI关系载体的一个呈现。”
如果这个未来兑现,数字人的概念,也将跳出现有的科技和商业叙事,跳进一个更大的“圈”中。当然,百度一镜的效果到底好不好,在海外市场的进展是否顺利,还有待观察;而真人主播是否会被AI主播PK掉,还是会有新的创新模式出现,也值得我们期待。