视频通话功能上线!豆包App将视觉理解能力延伸至视频场景
创始人
2025-05-23 20:42:18
0

新浪科技讯 5月23日下午消息,豆包App近日上线实时视频通话功能,用户在电话界面开启视频画面后,豆包能基于真实场景与用户进行实时问答互动。

据介绍,旅行过程中,用户可打开其视频通话,询问所处景点的历史背景、特色内容或路线规划等。例如,用户在故宫参观时,可以通过视频向“豆包”展示景点画面,了解特定宫殿的历史故事、建筑特色,实现“边走边聊”。在博物馆、美术馆等场景,也可以打开视频通话功能,随时问豆包展品的背景信息。

据悉,该功能基于最新的豆包视觉理解模型。模型拥有较好的内容识别、理解推理和内容描述能力,能够融合视觉与语言输入,进行综合的深度思考和创作。根据图像信息,豆包视觉理解模型还能完成诸多复杂的逻辑计算任务,包括解微积分题、分析论文图表、诊断真实代码问题等挑战性任务。

此外,为进一步提升对话的准确性与时效性,豆包视频通话功能还接入了联网搜索能力,实时获取互联网最新信息。

去年底,豆包上线图片理解功能,支持上传图片后识别内容,包括理解梗图等。如今,豆包进一步升级,将视觉理解能力延伸到视频场景,让用户在生活场景中直接互动,大幅降低用户的交互门槛,打造边看边聊的智能化体验。(罗宁)

相关内容

热门资讯

vivo钱包遭用户投诉贷款利率... 文:WEMONEY研究室 随着移动互联网时代到来,智能手机已经成为了生活的必需品。目前,很多手机如...
gta5加载慢怎么办 gta5... 许多玩家在GTA5游戏过程中都会遇到加载速度慢的问题,那么gta5加载慢怎么办?今天加游加速器就来告...
原创 苹... 有不少朋友疑惑苹果iPhone 16 Pro和16 Pro Max有什么区别?该选择哪一款更好?各自...
iPhone 16系列手机网速... 在智能手机的世界里,网速往往是衡量一部手机性能的重要指标之一。 尤其是随着5G时代的到来,用户对于高...
舒福德智能床S300 Pro面... 8月13日,以“一键入眠 世界领先”为主题的舒福德智能床新品发布会在浙江嘉兴举行。中国睡谷的首次对外...
第五轮学科评估对比:西安交大突... 在之前的文章中,我们已经提及西安交通大学第五轮学科评估的表现可圈可点,新晋的3个A+学科:机械工程、...
小米怎么去除抖音水印保存?分享... 随着抖音的普及,越来越多的人喜欢在抖音上分享和观看短视频。当我们想要保存一些喜欢的视频时,往往会被视...
小米14T Pro海外定档9月... 【ITBEAR】9月23日消息,小米今日在X平台上宣布,旗下新款手机小米14T Pro定于9月26日...
邓宏魁、张涛、李亚栋、孙斌勇获... 出品 | 搜狐科技 作者 | 周锦童 8月16日上午10时,2024未来科学大奖新闻发布会在北京、香...