商汤科技李星冶:多模态大模型“所见即所得”让人机交互更顺畅
创始人
2025-07-11 12:21:08
0

新京报贝壳财经讯(记者罗亦丹)7月10日,2025贝壳财经年会开幕。在主题为“建设‘开源之都’:智AI未来,生态共澎湃”的首场论坛上,商汤科技集团大模型综合商务部执行商务总监李星冶回顾了人工智能从1.0时代到2.0时代的演变,并重点介绍了商汤在多模态交互技术上的突破与应用落地。他强调,人工智能正从传统的计算机视觉向“所见即所得”的多模态交互转型,这将深刻改变教育、文旅、客服等多个领域。

李星冶表示,在AI 1.0时代,商汤专注于计算机视觉技术,主要服务于政府和企业。

随着2023年大模型技术的兴起,AI进入2.0时代,商汤开始推动多模态交互的创新。李星冶解释,这不仅仅是文字指令的识别,而且是基于“所见即所得”的理念,整合视频、图像、语音等多种模态,实现与人类的实时互动。在现场,李星冶展示了通过画出一个“太乙真人”的卡通形象,唤起太乙真人语音并进行实时互动的场景。

李星冶详细介绍了多模态交互的落地成果。在教育领域,商汤与学习机厂商合作,开发了“所见即所得”的交互设备。孩子佩戴设备后,算法能实时感知手写解题过程,识别错误并提供巧妙解法。针对低幼儿童,系统支持指读绘本,将图片转化为故事并互动。目前,商汤已与10所左右学校合作,打造智能校园助手,处理课程安排、成绩查询等功能。

此外,商汤科技的智能体应用是另一亮点。李星冶举例称,在仓库租赁场景中,算法分析行业数据辅助BD销售,生成租约管理方案等功能。在客服领域,商汤与知名运营商合作,打造高效智能体。在智能家居方面,提供家庭互动功能,以人工智能的技术丰富家庭交互生活。

“多模态大模型的优势正在于此:让交互不再局限于识别文字指令,更能通过‘所见即所得’的方式,通过视觉等多维度信息,让大模型与人之间的交互更顺畅。”李星冶说。

编辑 杨娟娟

校对 柳宝庆

相关内容

热门资讯

原创 苹... 有不少朋友疑惑苹果iPhone 16 Pro和16 Pro Max有什么区别?该选择哪一款更好?各自...
第五轮学科评估对比:西安交大突... 在之前的文章中,我们已经提及西安交通大学第五轮学科评估的表现可圈可点,新晋的3个A+学科:机械工程、...
原创 2... 从去年华为用上了麒麟芯片开始,华为的市场份额就蹭蹭的往上涨,当时抢购的人特别多,一时间还买不到现货,...
2025年值得入手的2款智能手... 在科技飞速发展的今天,智能手表已成为我们生活中不可或缺的伙伴。无论是健康监测、信息提醒,还是时尚搭配...
2024年OPPO手机全攻略:... 手机已不仅仅是通讯工具,它更是我们记录生活、享受娱乐、提升工作效率的重要伙伴。随着科技的飞速发展,O...
steam官网无法访问?这个办... 对于广大游戏爱好者而言,Steam平台无疑是获取最新游戏资讯、购买游戏、与全球玩家互动的重要阵地。然...
虚拟资料变现还值得做吗?闲鱼卖... 大家好,今天给大家带来的是咸鱼虚拟资料类项目分享,这个项目其实出来很久了,有些人觉得虚拟资料没水准,...
vivo钱包遭用户投诉贷款利率... 文:WEMONEY研究室 随着移动互联网时代到来,智能手机已经成为了生活的必需品。目前,很多手机如...
vivo手机5g开关在哪里打开 vivo手机5G开关的打开方式可能因手机型号、系统版本及运营商网络支持情况的不同而有所差异。但总体来...
解决FaceTime无法使用的... FaceTime是苹果公司推出的一款视频通话应用,广泛应用于iPhone、iPad和Mac等设备上。...