观点网讯:3月1日,据媒体报道,DeepSeek被传将于下周推出最新大模型V4。
据知情人士透露,该版本为原生多模态架构,可同步生成图片、视频与文本,并针对国产算力完成深度优化,意在降低对海外芯片依赖、加速推理环节本土化。
报道称,该公司同步准备一份简短技术说明,完整报告预计一个月后发布。
根据公开资料整理,正在秘密测试的V4 Lite代号“sealion-lite”,上下文窗口达100万tokens,较V3系列128K提升近8倍;参数规模约2000亿,完整版或突破1万亿。
资料显示,DeepSeek上次重大更新为2025年1月20日的R1推理模型,此次V4发布时间间隔超一年。
免责声明:本文内容与数据由观点根据公开信息整理,不构成投资建议,使用前请核实。