金融界2024年10月22日消息,国家知识产权局信息显示,阿维塔科技(重庆)有限公司申请一项名为“多音区语音识别方法、装置、设备及计算机可读存储介质”的专利,公开号CN 118762694 A,申请日期为2024年7月。
专利摘要显示,本发明涉及车载语音识别技术领域,公开了一种多音区语音识别方法、装置、设备及计算机可读存储介质,本发明的多音区语音识别方法通过多音区麦克风阵列获取声音信号;根据各音区麦克风阵列获取的声音信号确定声源位置;根据声源位置、声音信号的振幅和频谱特性对声音信号进行增益调整,获得优化语音信号;对优化语音信号进行识别,获得语音指令。由于是通过车内的多个音区的麦克风阵列分别获取声音信号对应的声源位置进行信号增益调整,能够对车内空间进行全面覆盖;通过各个麦克风阵列的协同工作,还可以进一步提高声音识别的准确性。本申请的方案在确保了车内的语音信号都能够被有效捕捉的同时,减少了环境噪声的干扰,提高了语音识别的准确性。
来源:金融界