语音交互方法、服务器和计算机可读存储介质

正文

推荐专利

申请号：CN202510374620

申请日期：2025-03-26

公开号：CN120319234A

公开日期：2025-07-15

类型：发明专利

摘要

本申请公开了一种语音交互方法、服务器和计算机可读存储介质。方法包括：根据获取到的当前语音请求和与当前语音请求相关联的目标图像，确定融合特征信息。接着，基于预设大语言模型，根据融合特征信息，进行语音交互。如此，通过融合当前语音请求和目标图像，能够准确地理解用户的意图，减少误触现象，提高语音交互的准确性和流畅性，从而增强用户体验。

技术关键词

融合特征图像特征信息音频特征信息车辆座舱大语言模型语音交互方法槽位识别矩阵深度学习架构可读存储介质视频流自然语言理解服务器计算机处理器接口存储器

系统为您推荐了相关专利信息

用於使用张量网络压缩大语言模型的系统和方法

大语言模型网络

基于多模态信息融合的操作控制方法、装置、设备及介质

多模态信息融合操作控制方法生成反馈信号控制执行器末端执行器

一种高压断路器故障诊断方法、系统、介质和设备

小波变换处理高压断路器连续小波变换故障诊断技术松动故障

一种基于跳步采样扩散模型的轻量化水下图像增强方法

水下图像增强方法编码器特征全局平均池化模块通道注意力机制

面向复杂需求的大语言模型代码生成系统及方法

代码生成系统大语言模型代码生成方法节点文本

语音交互方法、服务器和计算机可读存储介质

站点导航

APP 下载