国家知识产权局信息显示,腾讯科技(深圳)有限公司、华东师范大学申请一项名为“一种视觉感知方法及相关产品”的专利,公开号CN121686168A,申请日期为2024年9月。
专利摘要显示,本申请公开了一种视觉感知方法及相关产品。该方法包括:获取输入图像和输入文本,输入文本包括用于提示输入图像中的背景区域的第一文本内容;基于第一文本内容和视觉感知模型对输入图像进行推理,得到背景区域中的多个子区域分别对应的第一推理结果,多个子区域在背景区域中互不连通,多个子区域中的每个子区域的第一推理结果包括每个子区域的背景类别和预测掩码,每个子区域的背景类别基于每个子区域与第一文本内容之间的对齐分数得到;将多个子区域中属于相同背景类别的子区域所对应的对齐分数和预测掩码进行处理,得到第二推理结果,第二推理结果用于表示输入图像的处理结果。如此,视觉感知模型即可胜任各种不同的任务,提高通用感知能力。
声明:市场有风险,投资需谨慎。本文为AI基于第三方数据生成,仅供参考,不构成个人投资建议。
来源:市场资讯