3月11日,据东方财经援引媒体报道,有市场消息称,DeepSeek下一代AI模型DeepSeek-R2或提前于下周一(3月17日)正式发布。
DeepSeek-R2在多个关键领域实现突破,包括更出色的编程能力、多语言推理能力,以及以更低的成本提供更高的准确性。专业人士认为,这些特性若得以兑现,可能使其在全球AI竞赛中占据显著优势。
图源:VCG
DeepSeek,全称杭州深度求索人工智能基础技术研究有限公司,成立于2023年7月17日,是一家创新型科技公司,专注于开发先进的大语言模型(LLM)和相关技术。
根据DeepSeek公布的DeepSeek-R1信息显示,其在后训练阶段(Post-Training)大规模使用了强化学习(Reinforcement learning)技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩OpenAI o1正式版。
近期,DeepSeek访问使用量急速上升,已经成为目前最快突破3000万日活跃用户量的应用程序。
据央视新闻报道,记者从工业和信息化部了解到,三家基础电信企业已全面接入国产开源大模型DeepSeek。除了运营商的云平台外,手机、PC等终端厂商也在积极拥抱DeepSeek,一些地方政府也开始在政务系统部署DeepSeek。
技术人员介绍,首款搭载DeepSeek模型的安卓手机,除了AI任务处理效率大幅提高以外,接入DeepSeek后还将为用户带来深度思考、个性化服务等更加智能化的交互体验。
DeepSeek之所以受到业内的追捧,主要在于其创新的算法和高性价比。它不仅优化了计算资源的使用,还为国产芯片的发展带来了新的契机,推动行业向高效和绿色方向迈进。
专家指出,DeepSeek最大的优势就是性价比高。作为一个超级智能“大脑”,它不仅聪明,而且用起来还很划算。
微信编辑:吴祈
审核:林夕合
【来源:九派新闻综合东方财经、央视新闻、此前报道】
下一篇:AI“狂飙”背后的企业密码