DeepSeek惊艳世界,算力与应用将迎来结构性变化
创始人
2025-02-21 19:42:18
0

今天分享的是:DeepSeek惊艳世界,算力与应用将迎来结构性变化

报告共计:18页

《DeepSeek惊艳世界,算力与应用将迎来结构性变化》由东方证券撰写,探讨了DeepSeek发布的大模型DeepSeek-V3和推理模型R1对AI行业的影响。

1. 模型性能卓越且引发行业轰动:DeepSeek-V3在大模型主流榜单开源模型中位居榜首,与顶尖闭源模型性能相当,在知识、长文本、代码、数学等多领域测试成绩出色,生成速度大幅提升且API定价低。R1模型推理能力比肩OpenAI o1,开源多个模型并支持模型蒸馏,API服务性价比高。这两款模型训练成本极低,推出后使DeepSeek成为全球增速最快的AI应用,引发产业巨大反响,吸引众多科技领袖关注。

2. 技术创新多样:DeepSeek-V3在训练上,运用FP8精度训练、DualPipe双向流水线和跨节点通信技术降低成本;推理时,借助混合专家系统(MoE)和多头潜在注意力机制(MLA)提升效果,还通过多令牌预测(MTP)和模型蒸馏技术提高性能。R1-Zero尝试纯强化学习探索模型自主推理能力,R1则通过数据引导和多阶段优化,平衡推理性能与实用价值,其训练分冷启动、推理导向强化学习、拒绝采样+监督微调、全场景强化学习四个阶段 。

3. 影响算力与应用格局:在算力方面,虽模型降低了训练端算力消耗,但训练算力长期仍有前景,各厂商会借鉴优化方法。推理成本下降将刺激推理算力需求增长,“杰文斯悖论”可能应验。同时,DeepSeek模型促使AI芯片行业格局面临变化,其开源性及对芯片要求的降低,给国产芯片带来机遇,若美国收紧芯片限制,也会影响国产芯片份额。在应用方面,此前AI应用普及和商业化存在困难,DeepSeek的强推理能力、低算力成本和开源属性,有望推动AI应用繁荣。加上其他国产模型的突破,为国内AI应用发展奠定良好基础 。

以下为报告节选内容

报告共计: 18页

中小未来圈,你需要的资料,我这里都有!

相关内容

热门资讯

2025年值得入手的2款智能手... 在科技飞速发展的今天,智能手表已成为我们生活中不可或缺的伙伴。无论是健康监测、信息提醒,还是时尚搭配...
原创 苹... 有不少朋友疑惑苹果iPhone 16 Pro和16 Pro Max有什么区别?该选择哪一款更好?各自...
第五轮学科评估对比:西安交大突... 在之前的文章中,我们已经提及西安交通大学第五轮学科评估的表现可圈可点,新晋的3个A+学科:机械工程、...
原创 2... 从去年华为用上了麒麟芯片开始,华为的市场份额就蹭蹭的往上涨,当时抢购的人特别多,一时间还买不到现货,...
steam官网无法访问?这个办... 对于广大游戏爱好者而言,Steam平台无疑是获取最新游戏资讯、购买游戏、与全球玩家互动的重要阵地。然...
解决FaceTime无法使用的... FaceTime是苹果公司推出的一款视频通话应用,广泛应用于iPhone、iPad和Mac等设备上。...
vivo手机5g开关在哪里打开 vivo手机5G开关的打开方式可能因手机型号、系统版本及运营商网络支持情况的不同而有所差异。但总体来...
2024年OPPO手机全攻略:... 手机已不仅仅是通讯工具,它更是我们记录生活、享受娱乐、提升工作效率的重要伙伴。随着科技的飞速发展,O...
原创 最... 近日,有关华为nova 13系列手机的消息开始多了起来,之前透露的消息暴露,华为nova 13 Pr...
2024信号“最可靠”的四款手... 大家好!今天我要和大家聊聊2024年信号“最可靠”的四款手机,它们分别是华为Pura 70 Pro+...