AI耳机的多模态语音交互方法、电子设备和存储介质

正文

推荐专利

申请号：CN202510200281

申请日期：2025-02-24

公开号：CN119694314B

公开日期：2025-04-18

类型：发明专利

摘要

本发明提供了一种AI耳机的多模态语音交互方法、电子设备和存储介质，包括：采集用户的语音信号，基于隐马尔可夫模型，结合语音信号的概率分布特性识别语音信号中的起始与终止点，并截取出可用的语音段；对所述语音段进行语音识别，得到对应的文本信息；基于AI耳机内置的运动传感器，采集用户头部的运动数据；将所述文本信息与所述运动数据输入融合模型，融合得到交互意图特征；对交互意图特征进行解析，得到所述用户的交互意图；基于所述交互意图，驱动AI耳机执行对应的功能。在本发明中，可以精准识别语音信号中的起始与终止点；同时，克服了单模态交互方式无法精准解析用户需求的缺陷。

技术关键词

语音交互方法隐马尔可夫模型识别语音信号关键点耳机意图滤波语音信号文本多模态注意力情境要素运动传感器字符数据网络连接状态序列建立映射关系多模态交互

系统为您推荐了相关专利信息

一种车辆悬架控制方法、装置、计算机设备和存储介质

车辆悬架控制方法车辆悬架高度状态机模型模式车辆悬架控制装置

基于全局外观流与可变卷积技术的跨体态的虚拟试衣方法

虚拟试衣方法卷积技术模特注意力特征提取网络

一种健身运动参数计算方法及虚拟交互映射方法

参数计算方法人体关键点映射方法周期性算法

一种自动定位导游器及其工作方法

导游器 GPS导航模块语言模块语音识别模块控制模块

一种基于强化学习的髋臼周围截骨规划方法及装置

髋臼髋关节深度Q网络学习规划医学

AI耳机的多模态语音交互方法、电子设备和存储介质

站点导航

APP 下载