一种基于大语言模型的数字人交互方法及装置

正文

推荐专利

申请号：CN202411941771

申请日期：2024-12-26

公开号：CN119961429A

公开日期：2025-05-09

类型：发明专利

摘要

本申请公开了一种基于大语言模型的数字人交互方法及装置。所述方法包括：客户端获取用户输入的待交互语音信息、待交互视频信息、待交互文本信息；通过经过训练的所述多模态压缩模型对待交互语音信息、待交互视频信息、待交互文本信息压缩后获取第一压缩信息并发送给云端；云端进行解压缩；云端获取经过训练的大语言模型；云端将所述原始的待交互语音信息、原始的待交互视频信息、原始的待交互文本信息输入至经过训练的大语言模型中从而获取回复信息以及回复视频信息；云端将获取的回复信息以及回复视频信息通过所述云端多模态压缩模型进行压缩从而获取第二压缩信息；云端将第二压缩信息发送给所述客户端。

技术关键词

交互视频人交互方法大语言模型客户端节点语义语音多模态云端检验器特征提取器交互装置文本信息提取联合损失函数融合特征输入解码器图谱

系统为您推荐了相关专利信息

一种液冷冷板的分流网络仿真模型构建方法及系统

网络仿真 IT设备模型构建方法热源标记

一种GIS检修机器人机械臂路径规划方法及系统

节点检修机器人障碍物路径规划技术路径规划系统

用于边缘端监控设备的视频告警方法、系统、介质和设备

视频告警方法监控设备监控视频分析自定义图片二维码

一种智能火灾消防系统

智能火灾消防系统传感器节点控制灭火装置高维特征向量私有云

一种基于路径探索的知识图谱检索增强方法及系统

大语言模型关键词读取文本信息构建知识图谱实体

一种基于大语言模型的数字人交互方法及装置

站点导航

APP 下载