通义推出数字人李白,化身“语文老师”进学校教诗词
创始人
2024-09-11 11:00:31
0

9月10日,通义推出数字人李白,基于通义大模型打造,集合通义多模态技术实力,不仅在外貌上还原唐代诗人李白的中年形象,更在眼神、言谈举止间融入对李白诗词意境的理解与艺术再现。打开通义App,输入“李白”,便能和数字人李白开启一场即兴对话,既能吟诗作对,也可聊聊科技发展。

数字人李白刚上线,便于近期引入杭州刀茅巷小学,化身新学期一位特别的“语文老师”上了一堂公开课。“您写过的最长的诗是哪一首?”“《蜀道难》背后有什么故事?”……通义数字人李白引发了学生们的极大互动兴趣。面对一个个的好奇提问,李白不仅有问必答,而且引经据典,与学生们诗词接龙。

这种寓教于乐的方式使语文课变得更加有趣且高效。杭州市刀茅巷小学语文老师王敏蕾表示,“平时的语文课堂中就是课本,还有多媒体教学,像数字人一起参与,我觉得小孩子不仅从数字人身上感受到不一样的课堂以外,还能学到课本以外的知识。”

和需要大量视频作为训练数据,对真实人物进行复刻的传统数字人不同,通义推出的李白数字人,只需要一张图就可以生成具有全身动态的数字人,在这背后,是阿里通义大模型能力的“六剑客”。

大脑来自通义的模型Qwen,其语?理解、知识、代码、数学及多语?等多项能?显著领先。表情跟自然呼吸态来自EMO模型,最大化地保留模型创造力,使人脸表现力大大提升。肢体动作上,通义采用了强控制方法AnimateAnyone,用针对人体建模的骨架图片来驱动人物动作,也是曾爆火全网的“全民舞王”背后的技术。

语言模型来自通义语音实验室的CosyVoice技术,基于海量数据训练的生成式语音大模型,能够实现1-3句话声音克隆。为了让数字人有更好的实时对话能力,数字人李白还采用了VideoReTalking技术,它可以根据音频自动匹配嘴型。

未来,视觉语言大模型VL(Vision-Language)也将被应用在数字人交互领域,在情感识别、虚拟现实交互上提供更优质的互动体验。未来打开摄像头,用户便能与李白打破时空结界、体验身处一世的实时视频通话。

“李白是中国传统文化的一张名片,数字人李白让这位跨越千年的文学巨匠以全新的形态‘活’在当下,与全球观众互动,激发更多人对古典文学的兴趣与热爱。”通义数字人产品经理龙慧表示,未来,从线上教学到虚拟旅游,数字人将在教育、文化旅游、数字娱乐等多个领域展开广泛应用的计划。

相关内容

热门资讯

vivo钱包遭用户投诉贷款利率... 文:WEMONEY研究室 随着移动互联网时代到来,智能手机已经成为了生活的必需品。目前,很多手机如...
原创 苹... 有不少朋友疑惑苹果iPhone 16 Pro和16 Pro Max有什么区别?该选择哪一款更好?各自...
第五轮学科评估对比:西安交大突... 在之前的文章中,我们已经提及西安交通大学第五轮学科评估的表现可圈可点,新晋的3个A+学科:机械工程、...
虚拟资料变现还值得做吗?闲鱼卖... 大家好,今天给大家带来的是咸鱼虚拟资料类项目分享,这个项目其实出来很久了,有些人觉得虚拟资料没水准,...
2024年OPPO手机全攻略:... 手机已不仅仅是通讯工具,它更是我们记录生活、享受娱乐、提升工作效率的重要伙伴。随着科技的飞速发展,O...
gta5加载慢怎么办 gta5... 许多玩家在GTA5游戏过程中都会遇到加载速度慢的问题,那么gta5加载慢怎么办?今天加游加速器就来告...
原创 2... 从去年华为用上了麒麟芯片开始,华为的市场份额就蹭蹭的往上涨,当时抢购的人特别多,一时间还买不到现货,...
iPhone 16系列手机网速... 在智能手机的世界里,网速往往是衡量一部手机性能的重要指标之一。 尤其是随着5G时代的到来,用户对于高...
解决FaceTime无法使用的... FaceTime是苹果公司推出的一款视频通话应用,广泛应用于iPhone、iPad和Mac等设备上。...
舒福德智能床S300 Pro面... 8月13日,以“一键入眠 世界领先”为主题的舒福德智能床新品发布会在浙江嘉兴举行。中国睡谷的首次对外...