2025-09-16 15:27:02 作者:狼叫兽
9月12日,海天瑞声联合创始人、CEO李科受邀出席 2025 Inclusion·外滩大会 “Data meets AI:智能时代的双引擎” 论坛,并发表《大模型时代下的数据探索与实践》主题演讲,聚焦大模型时代下的数据新范式及海天瑞声在人工智能数据领域的实践探索与落地应用。
9月11日,上海黄浦世博园区,以 “重塑创新增长” 为主题的2025 inclusion·外滩大会正式开幕。作为亚洲最具影响力的金融科技盛会之一,外滩大会以其开放、多元、前瞻性吸引全球目光。
“Data meets AI:智能时代的双引擎” 见解论坛,由中国人工智能学会、上海交通大学与蚂蚁集团联合主办,会上围绕 “可供大模型训练的人类数据日益稀缺,Scaling Law逐渐失效,智能上限如何突破?” 这一话题,产学界的多位权威专家给出了新解法:数据驱动了AI发展,AI也让数据迎来了新一轮的进化,双引擎融合驱动才是演进方向。
会上,海天瑞声联合创始人、CEO李科发表《大模型时代下的数据探索与实践》主题演讲,从产业实践角度分享了全球AI数据行业的发展趋势,为行业提供大模型时代下数据产业发展的前沿视角。
高质量数据集构建成为大模型发展的新突破口
数据作为智能时代的第一引擎,正从辅助角色转变为核心驱动力。
李科指出,高质量数据集的系统化建设与产业化应用,是推动大模型发展的新突破口。他强调:“未来的大模型不只是追求数据量,更在于数据质量的跃升。” 数据产业正在经历从劳动密集型向技术密集型和知识密集型的重大转型。
在现场,李科还详细讲解了具身智能数据的设计与采集方法,展示了如何通过动作捕捉与传感器融合获取更贴近真实物理世界的数据;分享了自动驾驶数据的智能标注流程,借助平台化工具实现复杂交通场景的高效处理;并介绍了思维链数据集的生产过程,强调通过标注推理过程来提升大模型的逻辑性与可解释性。
技术创新推动数据价值释放
作为第二引擎,AI技术正在深刻改变数据处理和利用的方式。
李科指出,数据产业正在向智能化、工程化、平台化加速迈进,海天瑞声自主研发的DOTS一体化数据处理平台,覆盖数据采集、清洗、标注、质检、管理一体化工程化数据服务,支持全模态数据自动化标注、高效数据质量控制、项目柔性管理、数据安全与合规保障,确保客户利用高质量的多模态数据训练出更强性能的大模型。
展望未来,只有实现数据与AI的深度融合,建立完善的数据标准体系和质量评估框架,才能真正释放智能技术的巨大潜力,推动智能时代向更高层次发展。海天瑞声凭借在数据领域的深厚积累和技术创新,正积极推动AI数据产业的标准化、智能化发展。未来,公司将持续携手行业伙伴,以高质量数据赋能千行百业,共同探索人工智能产业落地的新路径,为构建更加智能、高效、包容的未来社会贡献力量。