央广网北京6月18日消息(记者 纪爱玲)近日,工信部与国家数据局联合发起的2026“模数共振”行动,业内人士分析认为,要实现二者的深度耦合,关键在于构建AI就绪数据基础设施,让模型与数据互为燃料,彼此成就。针对这一问题,央广财经记者就“数模共振”如何推动科技与产业双向赋能采访了科杰科技董事长于洋。
于洋表示,过去几年,通用大模型的参数规模与推理能力突飞猛进,但它在面对工业炼化装置的异常预警、汽车的工艺优化或医院的辅助诊断时,往往因“不懂行话、不知规矩”而束手无策。另一方面,能源、制造、医疗等传统领域虽积累了PB级数据,却大多沉睡在孤立系统中,格式杂乱、标准不一,难以直接被算法利用。
“模数共振”正是要打破这两条平行线的隔阂。于洋强调,搭建“数据底座 + AI 平台 + 智能体入口”三位一体的技术架构,能把企业沉淀了几十年的“老法师经验”转译为模型能够理解的语言,让两者真正形成共振。
科杰科技KeenData LakeHouse数据智能平台:模数共振技术体系(科杰科技资料 央广网整理)
于洋表示,这一行动若能落地,将实现三重价值:一是利用大模型的语义理解与代码生成能力,大幅简化传统AI应用的开发流程;二是为模型提供经过治理、标注、持续更新的高质量行业数据集,避免“垃圾进、垃圾出”;三是让智能化成果有效反哺实体经济——通过在具体业务场景中孵化具备执行力的智能体(Agent),切实产生降本增效的经济价值。
从“单向喂养”到“双向奔赴”:Data for AI 与 AI for Data
要让共振发生,首先得解决一个基础问题:企业现有的数据平台,大多是为BI报表和业务系统设计的传统数据库或数仓,主要存储结构化交易数据,其中包含的大量杂质的非结构化数据会严重影响模型运转效率和产出质量。
“AI就绪数据底座”的诞生攻克了三大技术关卡。一是数据治理自动化,二是极致的时效性保障,三是多源异构数据工程的统一处理。
科杰科技将自己定位为“AI数据基础设施提供商”,其核心价值在于构建面向AI训练和推理的全模态数据实时采集、自动化治理与版本管理的能力。
一方面,是Data for AI。依托经过规范治理的高质量行业数据,再结合深厚的行业知识积淀,为大模型注入了行业“老法师”的经验养分。在石油行业,炼化装置的历史运行数据让工艺优化模型更懂行业边界;在汽车产线,传感器数据让视觉大模型具备了像老法师般识别微缺陷的“直觉”。
另一方面,是AI for Data。大模型的语义理解与生成能力,反过来激活了沉睡的数据资产。在医疗领域,大模型能从非结构化病历中自动提取专病特征,构建高质量临床数据集,反哺药物研发;在教学课堂,它能解析长期积累的教学行为数据,生成个性化的学习路径。
这种“以模引数、以数强模”的双向奔赴,让数据不再只是静态资产,成为流动的智能燃料。
数据、模型、场景深度融合 共促行业协同高质量发展
在产业实践中,“模数共振”的实现需要数据基础设施厂商、大模型厂商和行业应用方三方紧密合作,各自发挥专业优势,共同推动AI技术的落地应用。
AI数据基础设施厂商的职责是打造企业数据的“翻译器”与“连接器”,大模型厂商的核心价值在于提供坚实的基础能力。在制造业、能源、金融等垂直行业,AI应用的成败不仅依赖于技术的先进性,更关键的是对行业特有需求的把握及数据资源的深入挖掘。
央企的实践表明,只有将通用AI能力与企业特有的业务流程、知识经验相结合,才能开发出真正有价值的智能化应用。
于洋补充道:“从长期来看,‘模数共振’不仅是一项技术战略,更是一种产业思维。它强调数据与模型的相互促进、相互成就——高质量数据能够提升模型的应用效果,而智能模型又能反向推动数据治理的完善和价值挖掘的深入。”
在数据与模型相互赋能的新范式下,那些能够率先构建高质量数据底座、将行业知识与AI能力深度结合的企业,将在智能化转型的浪潮中获得显著竞争优势。这场由数据驱动、模型赋能的产业变革,其价值将在各行各业的实际应用中逐步显现。