《具身智能:从虚拟AI到现实AI》,杜雨 张孜铭 著,中译出版社出版
智能,从何而来?它不仅来自大脑,也和身体息息相关。人工智能发展至今,正在从虚拟走向现实——人形机器人、自动驾驶汽车、智能家居产品……人工智能的大脑需要装入不同的身体,才能更好地感知世界万物。当感知化为认知,认知促成行动,最终所形成的便是具身智能。具身智能是人工智能的一个发展领域,指一种智能系统或机器能够通过感知和交互与环境进行实时互动的能力。可以简单理解为各种不同形态的机器人,让它们在真实的物理环境下执行各种各样的任务,来完成人工智能的进化过程。本书系统性地介绍了具身智能的技术原理、应用案例、发展机遇与挑战,力图为读者展现一幅人机共生的未来蓝图。
>>内文选读
你听说过“缸中之脑”吗?
这是希拉里·普特南(Hilary Putnam)1981年提出的著名思想实验。在这个实验中,你的大脑被从身体上切了下来,放进了充满营养液的玻璃缸中。大脑的神经末梢都被连接在了计算机上,由计算机模拟出所有对于世界的感知和记忆。在这样的假设下,一个基本问题就会暴露在所有人面前:“你如何保证现在的自己就不是缸中之脑呢?”
也许我们很难证明或证伪这个思想实验,但却可以把视角转移到实验背后的基本假设上——“我们的智能完全来自我们的大脑”。
图源:视觉中国
这个假设非常具有唯物主义色彩,但似乎不那么牢靠。假如人类都是全身长满眼睛的球形体,似乎我们就很难具备有关自己“面前”和“背后”的相关认知;假如你在海鸥的身体内诞生,你对于这个世界的了解也肯定区别于在人类身体里所形成的一切。我们所具备的知识、技能和智慧,不仅取决于我们的大脑,还取决于我们的身体,以及身体在和世界的交互中所获得的反馈。
就像学习跳舞时,优秀的舞者从来不是靠画面来记忆动作的,而是靠体验去习得动作的。在我们起舞时,思想占据了我们的身体,所有感官变得活跃,通过感官,思想可以去感受、去聆听,并遵循身体的智慧,最终形成了曼妙的舞姿。
感知化为认知,认知促成行动,这就是我们的智能,具备身体后形成的智能。
当人们想创造出拥有智能的机器时,自然也参考了这种思路。特别是到20世纪末期,人工智能领域行为主义学派的蓬勃发展,将这种思想逐步推向了高潮。相较于注重数理逻辑和推理的符号主义、模拟神经元仿生结构的联结主义,行为主义起源于控制论,更关注在“感知—行动”的链路中,与现实环境不断交互所诞生的智能。这一学派也在吸纳其他学派思想精华的基础上,持续引领着智能机器人等行业的繁荣。
直到今天,人们越来越发现,要想让人工智能充分影响现实世界,需要将智能嵌入身体,在与环境的互动中不断进化,这也是本书重点讨论的主题——具身智能。不过,鉴于具身智能还是一个快速迭代的全新领域,本书会适当扩展这一概念的外延,把所有嵌入实物身体上的人工智能,统称为具身智能。
当人工智能嵌入人形机器人时,它就变成了具身智能机器人;当人工智能嵌入汽车时,它就变成了自动驾驶汽车;当人工智能嵌入家居设备时,它就变成了智能家居产品。可以说,人工智能在嵌入实物身体的同时,也嵌入了我们的生活,影响着我们生活的方方面面。
智能的人形机器人,可以更加适配人类的生活场景,现实世界的建筑、工具、设施都是为人类所设计的,人形的具身智能机器人很容易就能帮我们分担各种家务和工作。自动驾驶的汽车,不仅可以方便人们的出行、减缓司机长途驾驶的疲惫,还可以改善整个交通系统的运作效率。而智能家居,在让我们的日常生活变得更轻松的同时,也让整个家庭环境变得更加安全与温馨。相信在不久的将来,我们的世界就会变成人类与机器和谐相处的世界。
2023年初,针对ChatGPT等AIGC领域的技术爆发,许多教育界的专家学者已对未来“机器替代”的趋势展开了密切的讨论,并重新审视了当今中国的教育现状。而面对未来具身智能的发展,当强大的AI拥有了身体,中国的教育又该何去何从,这无疑是同样重要的话题。
教育是一个国家新生的潜质变量,教育更好才会有更好的人才,综合国力才可能会更强。当具身智能与教育领域相遇时,我们面对的是对既有教育模式的重新评估,以及如何整合这一新兴趋势来优化教育体系的问题。从宏观上来看,具身智能与教育的结合存在方向上的分歧,这也是培养下一代人成长的交叉和分歧点。从微观上看,在学校的教育环境中,是否应该引入具身智能等人工智能技术来协助教育学习过程,许多学校还举棋不定。参考之前AIGC领域的发展,一些学校反对学生使用ChatGPT写论文,但也有部分学校支持学生使用。解决分歧,在保证教育质量的同时,不阻碍新技术的积极影响,将会是未来推进具身智能在教育领域应用的重要命题。
●具身智能教育应用的相关案例
虽然具身智能在教育领域的应用尚不成熟,但我们仍能看到许多优秀的早期案例。在下面的内容中,我们将对部分案例进行介绍。
1.机器人Furhat
2022年,瑞典的一家初创公司FurhatRobotics推出了一款智能机器人Furhat,这款机器人可以通过面部表情、声音和身体语言与人进行自然的交谈。相比于传统的交互式机器人,Furhat最大的特点是具有高度的面部表现力,这种表现力来自自然的头部运动、流畅的面部姿势以及与眼睛注视的结合。此外,该机器人还内置了脸部和眼睛的微动等行为,给人以真人一样的感觉,例如在强调某个词或瞥一眼另一个人时,它会微微扬起眉毛。
除了依靠脸部动画和3D建模打造面部外,Furhat还具有超强的感知和交互能力。Furhat能够使用计算机视觉技术实时跟踪多个用户,进行面部表情分析,估计头部姿势和用户距离,还能通过组合的视觉和音频输入,最多与10个人进行互动,并在互动中记住和区分他们。在交互时,它不仅能在嘈杂环境中精准地捕捉声音,还具有强大的自然语言理解能力,支持多语种流畅对话。在对话中,它还会分析用户的参与度、注意力以及内心状态,用目光或微笑给予幸福、惊讶、愤怒、悲伤等情绪回应。
Furhat已经拥有实际的工作经验,它曾在德国法兰克福机场担任引导员(图源:网络资料图片)
当前,Furhat在教育领域可以扮演多样化的角色,既能帮助孩子在学习上进步,也能提升孩子的社交能力和创新思维。在学习方面,Furhat可以模拟真人口语交谈场景,帮助孩子练习外语,增强他们的语言运用,也可以设置进行各种学科的模拟训练,比如数学题目解答、科学知识讲解等,帮助孩子们提升具体的学习技能。通过和机器人进行互动,孩子们可以学习社交规则和增强自己的社交能力。不仅如此,它还能理解和回应人类情绪,提供情绪上的支持和安慰,陪伴孩子度过孤独的时刻。
2.机器人Misa
Misa由Misa Robotics LLC公司研发,能够在日常生活中扮演各种角色,帮助用户的生活更加便捷。Misa可以利用先进的自然语言理解功能以及语音与周围的人进行互动和交流,从而与家人建立关系,并且其独特的互动性和移动性,可以使它在家与孩子一起玩耍、感知障碍物。在教育孩子方面,Misa将寓教于乐这一点落实得很好,热衷于激发孩子们的玩耍、参与和创造力,作为他们未来成功的基础。Misa内置了丰富的教育App,包括数学、科学、编程、语言学习等各种学科,可以满足不同年龄、不同兴趣的孩子们的学习需求。而且,与传统的书本学习相比,Misa以游戏和互动的方式进行教学,使孩子在玩耍的同时也能学到知识。Misa的高度交互性,能够对孩子的命令或问题进行反馈。这不仅能吸引孩子的注意力,也能激发他们探索和学习的兴趣。除了学科教育外,Misa在生活教育方面做得同样出色,可以通过故事、视频、交互游戏等形式,为孩子灌输正确的行为举止与健康的生活习惯。此外,Misa还具有儿童安全模式,可以防止孩子接触不适当的内容,保证安全的在线学习环境。同时,即使父母不在家也能通过视频通话的功能看着孩子做作业,或者由老师远程辅导。
3.Cobot S Kit
为了更广泛地培养具身智能领域的人才,针对该领域的科研教育建设是必不可少的。针对这一场景,松灵机器人推出了Cobot S Kit的具身智能科研教育平台。Cobot S Kit的科研教育解决方案深度整合了移动机器人平台、精确传感、AI大模型技术,以及灵活的机械臂设计,为科研教育提供了一个优质的模拟实验环境。Cobot S Kit的配置足以满足科研教育实践的高标准要求,它搭载了高精度的传感技术,配合强大的算力为机器人提供了在复杂环境中的实时建图、路径规划、自主导航及动态避障的能力。而其轻量级6轴机械臂和夹持式机械夹爪,可以让学生轻松完成机械臂的运动学习、仿真、运动路径规划和运动控制等相关任务的实践。
此外,顶端云台搭载的相机系统类比于人的头部和视觉系统,增强了机器人的环境感知和适应能力,让机器人能够更为全面地评估各种环境变化并适应不同的任务需求,并且内部还嵌入了先进的视觉抓取技术,可以实现从不同角度和距离对各类物体的精确抓握。更具特色的是,Cobo S Kit还具备大模型训练的接入能力,不仅能支持如ChatGPT这样的大模型,还能够在特定场景下进行机器人程序的设计与训练,极大地增加了学习过程的实践性和互动性。利用这样的平台进行具身智能领域的科研教学,不仅能让教学过程变得更加直观,而且也有助于提升学生的动手实践能力。
(本文摘编自本书前言及第七章)
作者:
文:杜雨 张孜铭 编辑:金久超 责任编辑:朱自奋