金融界2024年10月22日消息,国家知识产权局信息显示,平安科技(深圳)有限公司申请一项名为“一种语音识别方法、网络模型、设备及存储介质”的专利,公开号 CN 118762691 A,申请日期为 2024年7月。
专利摘要显示,本申请公开了一种语音识别方法、网络模型、设备及存储介质,通过结合UNet和高效注意力机制,更好地捕获和利用多尺度的细节信息,从而提高语音识别的准确性,其中UNet的跳跃连接有助于保留关键的时频特征,并将其传递到解码阶段,使得识别结果更加精确;高效注意力机制则使网络能够更好地建模长范围上下文的依赖关系,捕捉语音信号中的全局信息,提高对上下文的理解和建模能力。将UNet的U型结构嵌入到Transformer框架下,可以充分利用跳跃连接和特征重用的优势,减少网络的参数量,同时加速网络的训练过程,提高系统的效率和实用性。
来源:金融界