摘要
本发明公开了一种基于AI大模型的音响交互意图识别与智能决策方法,涉及智能语音交互技术领域,包括,通过声学传感器采集语音信号并进行降噪处理和声学特征提取,同时捕获文本指令进行语义分句和文本特征提取,将声学特征向量与文本特征向量拼接形成多模态数据包;基于强化融合特征向量检索历史记忆库生成记忆上下文向量,通过两阶段意图推理模型识别主意图类别并解析操作参数,输出结构化意图指令;对结构化意图指令进行参数合法性校验、设备状态验证及安全风险评估,修正异常参数后封装为可执行指令集。本发明通过频带能量占比与词项重要性评分的双重筛选,使声学‑文本特征尺度差异降低。
技术关键词
智能决策方法
意图识别
意图指令
文本特征向量
音响
信噪比估计值
智能语音交互技术
声学传感器
记忆
掩码矩阵
两阶段
注意力机制
语义特征
融合特征
参数
多模态
系统为您推荐了相关专利信息
睡眠设备
动态优化系统
LSTM模型
灯光
环境光线强度
神经网络深度学习
驾驶意图识别方法
注视点
意图分类识别
非暂态计算机可读存储介质
时间序列预测方法
深度学习模型
深度学习神经网络
注意力机制
文本特征向量