DeepSeek改写产业期待 大模型凭啥被社会所爱
创始人
2025-02-06 01:41:13
0

羊城晚报财经评论员 戚耀琪

春节期间,被国人所关注且大量“玩耍”的一个工具就是AI大模型DeepSeek。它之所以掀起了又一波的大模型平民化的浪潮,大概有两个原因,一个是回答更加千人千面且具有更好的真人思考状态,二是免费,你爱怎么弄都行,几乎都有求必应。当然,它出自中国,也让国人的使用门槛降低,避免了往日与西方科技界之间的那种知识与语言的鸿沟。

其实就其成功的核心而言,它被业界称为开创性地实现了“轻量化知识蒸馏”技术。这就意味着,相当于将千亿参数大模型的智能压缩到移动端可承载的小体积,类似于让2G网络用户也能使用AI服务。由于DeepSeek V3引入了独特的专家混合(MoE)模型架构,在推理时可以选择部分模型进行计算,避免了大量不必要的计算,提高了模型的运行效率。这样一来,它的平民化普及就成了更高的条件。所以甚至有人说从此对算力的需求不再那么令人感到焦虑了。

是的,在资讯极大丰富的时代,过往的大模型依然是一种对大数据进行极其复杂的汇编演绎,然后使其顺理成章,并貌似创造产品那样去回应咨询者。然而,当人们需要的不只是资讯的大杂烩,而是更深层的思考,更有方向感的导向时,AI的升级也就势在必行。因此DeepSeek V3的关键就在于通过思维链条,逐步分解复杂的问题,一步步得到令人意想不到的甚至惊叹的结果。如此高效训练,采用多令牌训练目标、多头潜在注意力等技术,提高了数据处理效率,减少了计算量,提升了模型性能,也能在一定程度给出更精准而不是泛泛而谈的内容。

此外,应用场景的丰富也让这个大模型工具能够在很多地区迅速得以应用。比如媒体就报道了,在撒哈拉以南地区,DeepSeek的医学影像诊断模块准确率已达三甲医院主治医师水平,为医疗资源匮乏地区提供了帮助。其独创的文化基因解码器可识别2000种文化符号,帮助不同文化背景的人在对话中消除文化误读。如此等等,貌似并不是DeepSeek的首创,但确实是性能调优之后的一种巨大进化。

因此,通过不断优化模型架构和训练方法,在降低成本的同时提升性能,进而能惠及大众,这才是一家科技公司及其产品了能够被社会接受和尊重的原因。相比之下,如果只是靠换个马甲,模仿名称、借鉴外表甚至全盘山寨,然后就赶紧靠注册会员充值一年赚一笔的商业模式,就显得非常低档且短期。因为在不断迭代的大模型面前,使用这种收割法的公司基本也只能是短命行为。别说引领科技潮流,连服务还能不能持续都很成问题,当然也很难获得人们的真正拥抱。

相关内容

热门资讯

原创 苹... 有不少朋友疑惑苹果iPhone 16 Pro和16 Pro Max有什么区别?该选择哪一款更好?各自...
2025年值得入手的2款智能手... 在科技飞速发展的今天,智能手表已成为我们生活中不可或缺的伙伴。无论是健康监测、信息提醒,还是时尚搭配...
第五轮学科评估对比:西安交大突... 在之前的文章中,我们已经提及西安交通大学第五轮学科评估的表现可圈可点,新晋的3个A+学科:机械工程、...
原创 2... 从去年华为用上了麒麟芯片开始,华为的市场份额就蹭蹭的往上涨,当时抢购的人特别多,一时间还买不到现货,...
steam官网无法访问?这个办... 对于广大游戏爱好者而言,Steam平台无疑是获取最新游戏资讯、购买游戏、与全球玩家互动的重要阵地。然...
解决FaceTime无法使用的... FaceTime是苹果公司推出的一款视频通话应用,广泛应用于iPhone、iPad和Mac等设备上。...
vivo手机5g开关在哪里打开 vivo手机5G开关的打开方式可能因手机型号、系统版本及运营商网络支持情况的不同而有所差异。但总体来...
2024年OPPO手机全攻略:... 手机已不仅仅是通讯工具,它更是我们记录生活、享受娱乐、提升工作效率的重要伙伴。随着科技的飞速发展,O...
原创 最... 近日,有关华为nova 13系列手机的消息开始多了起来,之前透露的消息暴露,华为nova 13 Pr...
2024信号“最可靠”的四款手... 大家好!今天我要和大家聊聊2024年信号“最可靠”的四款手机,它们分别是华为Pura 70 Pro+...