DeepSeek时刻:云巨头集中接入
创始人
2025-02-05 09:41:13
0

2月2日—4日,腾讯云、百度智能云、阿里云先后接入DeepSeek相关大模型,而大厂在春节假期为深度求索公司加班,只是DeepSeek爆火的一个证据。英伟达市值蒸发创纪录、OpenAI上新o3-mini推理模型、DeepSeek卡顿、榜单第一……与深度求索直接间接相关的新闻,在春节期间不断刷新。

单论拥抱DeepSeek,海外同行的动作更快,微软、英伟达、亚马逊云科技等在1月底就已接入。据称DeepSeek以3%的成本超越了OpenAI,且开源,这意味着以低成本已可训练出足够好的AI模型。不管是为了客户的多样化需求,还是为了构建AI生态,云厂商快速接入最火的大模型,都是笔划算的买卖。

七巨头集结

“让更多开发者便捷调用DeepSeek,腾讯云再出一把力。”2月4日,腾讯云又一次拉近与DeepSeek的距离,在腾讯云TI平台推出“开发者大礼包”:DeepSeek全系模型一键部署,部分模型限免体验。在此之前,腾讯云已在2月2日宣布将DeepSeek-R1大模型一键部署至腾讯云“HAI”上,开发者仅需3分钟就能接入调用,一改以往慢吞吞的风格。

更早打出低价牌的是百度智能云,2月3日,百度智能云千帆平台正式上架DeepSeek-R1和DeepSeek-V3模型,并推出超低价格方案,用户还可享受限时免费服务。

北京商报记者了解到,目前腾讯云TI平台采用按量计费和包年包月计费模式,百度智能云千帆平台限时免费2周至2月18日24:00。

阿里云也在春节期间就开了工,“大年初六,我们进入正题”,阿里云以此开场,在2月3日宣布阿里云PAI ModelGallery支持云上一键部署DeepSeek-V3、DeepSeek-R1。

对于费用,阿里云相关人士以全部部署好所需资源为例向北京商报记者介绍,“部署DeepSeek-R1-Distill-Qwen-7B模型的价格约为11.1元/小时(以A10机型为例);部署DeepSeek-R1模型的价格约为316元/小时。模型部署成功后按实例运行时长计费,不满1小时按具体分钟数折算计费”。目前阿里云百炼平台也已上线DeepSeek-R1和DeepSeek-V3模型API,且面向用户限时免费中。

华为云则在2月1日即宣布,硅基流动与华为云团队联合首发并上线基于华为云昇腾云服务的DeepSeek-R1/V3推理服务。

这波比拼中,不在春节假期的海外公司占了先机。

1月31日,英伟达宣布,NVIDIA NIM(一种云原生微服务技术)已经可以使用DeepSeek-R1。微软同日称已将DeepSeek-R1正式纳入Azure AI Foundry,成为该企业级AI服务平台的一部分。

亚马逊云科技(AWS)也宣布:企业和开发者可以在Amazon Bedrock和Amazon SageMaker AI中部署DeepSeek-R1模型,还可以使用AWS Trainium等以经济高效的方式部署DeepSeek-R1-Distill模型。

春节彩蛋

不是深度求索2025年1月20日发布的DeepSeek-R1,就是2024年12月26日上线的全新系列模型DeepSeek-V3,海内外大厂接入的,正是春节前就在各大主流媒体和社交网站刷屏的大模型“黑马”。

“突然间,美国在人工智能领域相对于中国的领先地位,似乎比自ChatGPT走红以来的任何时候都要小。”英国《经济学人》杂志评论,理由是“一家中国公司(即深度求索)发布了最新的令人印象深刻的大语言模型”。

从数据到体感,印象深刻的例子不难找。

七麦数据显示,1月27日至今,DeepSeek在中国内地免费苹果总榜、应用榜、效率榜均排在第一名,放大到全球榜单,截至北京商报记者发稿,DeepSeek在72个地区的免费苹果总榜、应用榜、效率榜位居榜首。

根据AI产品榜1月31日的数据,DeepSeek上线18天日活用户数1500万,ChatGPT达到同样的数据用了244天,增速是ChatGPT的13倍之多,DeepSeek被公认为是全球增速最快的AI应用。

除了大模型的真本事,春节或许也是DeepSeek加速扩散的原因之一。

2025年1月28日除夕夜,在互联网大厂工作的林悦(化名)把DeepSeek生成的拜年祝福分享在家族群。就这样,DeepSeek被“分发”到天南海北,那晚他给自己及亲戚好友生成了不低于10个新春祝福。第二天,林悦在西北四线城市生活的阿姨告诉他,自己在社交平台刷到了谈论DeepSeek的短视频。

再比如登上热搜第一的话题:“DeepSeek回答如何过好这一生”,它的回复是:“没有完美的人生剧本,所有选择都有代价,关键是要有承担选择的勇气。”北京商报记者也向DeepSeek提出了同样的问题,尝试多次后DeepSeek均显示“服务器繁忙,请稍后再试”,火爆程度可见一斑。

“拼多多”路径

需要强调的是,“中国的大语言模型并非最顶尖的,但它们的制造成本要低得多”,《经济学人》举例,阿里旗下的通义千问QwQ-32B-Preview于2024年11月推出,与美国的顶尖模型相比,差距不到3个月,DeepSeek在一项标准评估中排名第七。

报道称,DeepSeek是由2000多块二流芯片训练而来,Meta的模型则用了1.6万块顶尖芯片。在某些排名中,DeepSeek的表现甚至超过了Meta的模型。训练一个美国的大语言模型成本高达数千万美元,而且还在上升,而DeepSeek方面表示,其训练成本不到600万美元。

提到DeepSeek火爆的原因,工信部信息通信经济专家委员会委员盘和林表示,“DeepSeek采取低价和开源两条路并行的策略,尤其是开源,之前全球AI开发者都要看Meta的脸色,因为最有名的开源模型是Llama,有了DeepSeek,Llama立马不香了,而那些收费较高的,如ChatGPT则受到较大打击,免费和收费哪个香?很容易作出决断,DeepSeek也算中国第一个打通国内国外应用生态的产品”。

“模型成本的下降对产业链上的云服务厂商存在利好。”在比达分析师李锦清看来,这正是云厂商火速接入DeepSeek的原因,站在市场竞争力与商业价值看,“接入DeepSeek模型有助于云厂商提升自身在AI领域的竞争力,吸引更多开发者和企业客户。通过提供DeepSeek模型的部署和应用服务,云厂商可以拓展业务范围,增加收入来源”。

北京商报记者 魏蔚

相关内容

热门资讯

vivo钱包遭用户投诉贷款利率... 文:WEMONEY研究室 随着移动互联网时代到来,智能手机已经成为了生活的必需品。目前,很多手机如...
gta5加载慢怎么办 gta5... 许多玩家在GTA5游戏过程中都会遇到加载速度慢的问题,那么gta5加载慢怎么办?今天加游加速器就来告...
iPhone 16系列手机网速... 在智能手机的世界里,网速往往是衡量一部手机性能的重要指标之一。 尤其是随着5G时代的到来,用户对于高...
原创 苹... 有不少朋友疑惑苹果iPhone 16 Pro和16 Pro Max有什么区别?该选择哪一款更好?各自...
舒福德智能床S300 Pro面... 8月13日,以“一键入眠 世界领先”为主题的舒福德智能床新品发布会在浙江嘉兴举行。中国睡谷的首次对外...
第五轮学科评估对比:西安交大突... 在之前的文章中,我们已经提及西安交通大学第五轮学科评估的表现可圈可点,新晋的3个A+学科:机械工程、...
小米怎么去除抖音水印保存?分享... 随着抖音的普及,越来越多的人喜欢在抖音上分享和观看短视频。当我们想要保存一些喜欢的视频时,往往会被视...
邓宏魁、张涛、李亚栋、孙斌勇获... 出品 | 搜狐科技 作者 | 周锦童 8月16日上午10时,2024未来科学大奖新闻发布会在北京、香...
小米14T Pro海外定档9月... 【ITBEAR】9月23日消息,小米今日在X平台上宣布,旗下新款手机小米14T Pro定于9月26日...
如何规划小红书矩阵号内容并一键... 小红书矩阵号内容规划与抖音多账户同步攻略 在当前社交媒体时代,内容营销已成为品牌推广和个人IP打造的...