摘要
本申请公开了一种语音交互方法、服务器和计算机可读存储介质。方法包括:根据获取到的当前语音请求和与当前语音请求相关联的目标图像,确定融合特征信息。接着,基于预设大语言模型,根据融合特征信息,进行语音交互。如此,通过融合当前语音请求和目标图像,能够准确地理解用户的意图,减少误触现象,提高语音交互的准确性和流畅性,从而增强用户体验。
技术关键词
融合特征
图像特征信息
音频特征信息
车辆座舱
大语言模型
语音交互方法
槽位识别
矩阵
深度学习架构
可读存储介质
视频流
自然语言理解
服务器
计算机
处理器
接口
存储器
系统为您推荐了相关专利信息
多模态信息融合
操作控制方法
生成反馈信号
控制执行器
末端执行器
小波变换处理
高压断路器
连续小波变换
故障诊断技术
松动故障
水下图像增强方法
编码器特征
全局平均池化
模块
通道注意力机制
代码生成系统
大语言模型
代码生成方法
节点
文本