来源:华泰睿思
我们认为,DeepSeek对下游应用生态来说,降低了开发者门槛,加速了AI技术的普惠;激发开源社区创新,有助于应用场景的扩展,并看好三大方向。
核心观点
DeepSeek低成本+高性能,推动AI应用生态发展
DeepSeek最新大语言模型R1性能比肩GPT-o1;多模态模型Janus-Pro也正式发布。因其“低成本+高性能”的开源模式,DeepSeek成为全球增速最快的AI应用,并引发国内外产业圈和投资圈震动。我们认为,DeepSeek对下游应用生态来说,降低了开发者门槛,加速了AI技术的普惠;激发开源社区创新,有助于应用场景的扩展。我们看好:1)Agent类应用,可通过API集成来继承新一代LLM的能力,提升交互质量和效率;2)大模型能力向轻量化模型迁移,加速AI智能硬件渗透;3)利好下游传媒应用方向AI电商/AI玩具/AI情感陪伴/AI广告等的繁荣和商业化落地。
激发开源社区创新,扩大开源生态建设
DeepSeek在开源策略方面,采用“基础模型开源+高阶功能商业化”模式,将吸引开发者参与生态建设,激发社区创新。1月29日Hugging Face首席科学官表示DS-R1开源模型累计下载量超70万次,日增40%;用DS-R1搭建的衍生模型至少有670个,累计下载量超320万次,日增约30%。R1属于完全开源不限制商用,使用宽松的MIT License。我们认为,将利于更多开源模型利用R1蒸馏的标签数据增强推理加速迭代,开源项目可能成为行业事实标准,降低AI应用技术门槛。此外,采取闭源策略的大模型厂商也可能会考虑差异化开源策略,如OpenAI等。
模型推理能力提升,提升AI Agent交互质量和效率
DeepSeek R1大模型在推理、数学、代码等能力都有明显提升,使得RL算法平权。应用侧看,Agent通常依赖LLM来理解和生成自然语言,理解用户的需求并生成相应的响应,需求理解/挖掘能力的增强,便宜好用的长上下文,会提升Agent的落地效果。低成本开源大模型的持续迭代下,Agent可通过API集成来继承新一代LLM的能力实现进化,提升交互质量和效率。To B企业服务中,Agent正从任务执行变成决策支持伙伴;To C场景中,有助于提高生活场景的效率,并提供个性化服务。
大模型能力向轻量化模型迁移,加速AI智能硬件渗透
DeepSeek R1的出现将让产业界对基于CoT思路的优质合成推理数据的使用增加。DeepSeek通过知识蒸馏技术,实现大模型能力向轻量化模型的高效迁移,降低智能产品的AI功能集成门槛,开发者可快速将其AI能力部署至硬件设备并针对场景定制化。同时,凭借高效推理能力和低延迟响应的能力,DeepSeek能提升智能硬件交互的流畅度和场景理解的准确度,增强交互体验,助力AI智能硬件的普及渗透。我们预计,25年端侧小模型的技术迭代和降本增效将不断体现,未来免费端侧小模型可能百花齐放,助力端侧AI手机、AI可穿戴设备(眼镜/耳机等)、AI玩具、AI机器人等产品的发展。
DeepSeek影响下,利好下游AI应用繁荣和商业化落地