人工智能专题:DeepSeek重塑开源大模型生态,AI应用爆发持续推升算
创始人
2025-02-06 22:03:38
0

今天分享的是:人工智能专题:DeepSeek重塑开源大模型生态,AI应用爆发持续推升算力需求

报告共计:42页

国信证券发布的报告指出,DeepSeek在开源大模型领域发展迅猛,其成立于2023年7月,由幻方量化创立。2024年5月,DeepSeek-V2发布,成为全球最强开源通用MoE模型;同年12月,DeepSeek-V3发布,性能对齐海外领军闭源模型,在多项评测中表现优异,且训练成本仅557.6万美元。2025年1月,DeepSeek-R1发布,性能对标OpenAI-o1正式版,并开源模型权重和上线API。DeepSeek的成功得益于其技术创新,如采用MLA和DeepSeekMoE架构实现高效推理和低成本训练,构建DualPipe算法和混合精度训练优化计算与通信负载,通过分阶段强化学习提升模型性能,还利用硬盘缓存技术降低延迟和成本。在AI行业整体发展方面,Scaling Law与“涌现”能力推动大模型发展,模型数量和参数规模持续增长,全球AI大模型数量截至24年7月约1328个。AI模型向多模态转变,应用广泛,推动全球IT支出增长,生成式AI市场规模持续提高。同时,大模型训练和AI应用需求促使全球算力需求快速增长,智能算力成为构建大模型的重要底座,以AI服务器为代表的智能算力需求激增。英伟达凭借CUDA平台和不断迭代的GPU架构在AI算力领域占据领先地位,其GB200系统将赋能下一代AI模型。国内外云服务商资本开支快速增长,推动AI服务器市场规模大幅提升,AI服务器搭载AI芯片仍以GPU为主,但搭载ASIC芯片的服务器占比呈上升趋势,ASIC市场前景广阔,PCB行业也因算力需求增长迎来发展机遇 。

以下为报告节选内容

相关内容

热门资讯

原创 苹... 有不少朋友疑惑苹果iPhone 16 Pro和16 Pro Max有什么区别?该选择哪一款更好?各自...
2025年值得入手的2款智能手... 在科技飞速发展的今天,智能手表已成为我们生活中不可或缺的伙伴。无论是健康监测、信息提醒,还是时尚搭配...
第五轮学科评估对比:西安交大突... 在之前的文章中,我们已经提及西安交通大学第五轮学科评估的表现可圈可点,新晋的3个A+学科:机械工程、...
原创 2... 从去年华为用上了麒麟芯片开始,华为的市场份额就蹭蹭的往上涨,当时抢购的人特别多,一时间还买不到现货,...
steam官网无法访问?这个办... 对于广大游戏爱好者而言,Steam平台无疑是获取最新游戏资讯、购买游戏、与全球玩家互动的重要阵地。然...
解决FaceTime无法使用的... FaceTime是苹果公司推出的一款视频通话应用,广泛应用于iPhone、iPad和Mac等设备上。...
vivo手机5g开关在哪里打开 vivo手机5G开关的打开方式可能因手机型号、系统版本及运营商网络支持情况的不同而有所差异。但总体来...
2024年OPPO手机全攻略:... 手机已不仅仅是通讯工具,它更是我们记录生活、享受娱乐、提升工作效率的重要伙伴。随着科技的飞速发展,O...
原创 最... 近日,有关华为nova 13系列手机的消息开始多了起来,之前透露的消息暴露,华为nova 13 Pr...
2024信号“最可靠”的四款手... 大家好!今天我要和大家聊聊2024年信号“最可靠”的四款手机,它们分别是华为Pura 70 Pro+...