阿维塔科技申请多音区语音识别专利,能够提高语音识别的准确性
创始人
2024-10-23 01:20:42
0

金融界2024年10月22日消息,国家知识产权局信息显示,阿维塔科技(重庆)有限公司申请一项名为“多音区语音识别方法、装置、设备及计算机可读存储介质”的专利,公开号CN 118762694 A,申请日期为2024年7月。

专利摘要显示,本发明涉及车载语音识别技术领域,公开了一种多音区语音识别方法、装置、设备及计算机可读存储介质,本发明的多音区语音识别方法通过多音区麦克风阵列获取声音信号;根据各音区麦克风阵列获取的声音信号确定声源位置;根据声源位置、声音信号的振幅和频谱特性对声音信号进行增益调整,获得优化语音信号;对优化语音信号进行识别,获得语音指令。由于是通过车内的多个音区的麦克风阵列分别获取声音信号对应的声源位置进行信号增益调整,能够对车内空间进行全面覆盖;通过各个麦克风阵列的协同工作,还可以进一步提高声音识别的准确性。本申请的方案在确保了车内的语音信号都能够被有效捕捉的同时,减少了环境噪声的干扰,提高了语音识别的准确性。

来源:金融界

相关内容

热门资讯

原创 苹... 有不少朋友疑惑苹果iPhone 16 Pro和16 Pro Max有什么区别?该选择哪一款更好?各自...
2024年OPPO手机全攻略:... 手机已不仅仅是通讯工具,它更是我们记录生活、享受娱乐、提升工作效率的重要伙伴。随着科技的飞速发展,O...
2025年值得入手的2款智能手... 在科技飞速发展的今天,智能手表已成为我们生活中不可或缺的伙伴。无论是健康监测、信息提醒,还是时尚搭配...
原创 2... 从去年华为用上了麒麟芯片开始,华为的市场份额就蹭蹭的往上涨,当时抢购的人特别多,一时间还买不到现货,...
第五轮学科评估对比:西安交大突... 在之前的文章中,我们已经提及西安交通大学第五轮学科评估的表现可圈可点,新晋的3个A+学科:机械工程、...
vivo手机5g开关在哪里打开 vivo手机5G开关的打开方式可能因手机型号、系统版本及运营商网络支持情况的不同而有所差异。但总体来...
解决FaceTime无法使用的... FaceTime是苹果公司推出的一款视频通话应用,广泛应用于iPhone、iPad和Mac等设备上。...
steam官网无法访问?这个办... 对于广大游戏爱好者而言,Steam平台无疑是获取最新游戏资讯、购买游戏、与全球玩家互动的重要阵地。然...
原创 直... #热点周际赛# 随着科技的进步,儿童智能穿戴设备逐渐成为了家庭中的新宠。华为作为智能穿戴领域的领军者...
原创 麒... 为了普及原生鸿蒙(鸿蒙5.0),抢占更多的中端手机市场份额,华为nova系列今年开始计划一年两更,n...