一种基于多模态大模型的数字人交互方法及系统

正文

推荐专利

申请号：CN202411836451

申请日期：2024-12-13

公开号：CN119761511A

公开日期：2025-04-04

类型：发明专利

摘要

本发明公开了一种基于多模态大模型的数字人交互方法及系统，涉及数字人交互技术领域，方法包括：采集多模态输入数据，进行特征提取和时间同步；使用预设的多模态大模型对每种模态的输入数据进行编码，将编码结果映射到高维空间中，形成多个模态特征向量，进行权重分配，融合生成第一交互向量，提取意图特征表示，计算分析得到用户意图，构建语义关联网络；对语义关联网络进行图卷积操作，提取逻辑关系特征，根据意图特征表示和逻辑关系特征，生成数字人交互内容，通过输出接口传递给用户。通过对多模态输入数据的特征提取、多模态特征向量生成与语义映射技术，提升多模态数据的融合精确性、语义理解能力和交互响应的精准性与多样性。

技术关键词

人交互方法语义关联网络上下文特征多模态生成数字人意图类别交互内容投影算法编码特征节点特征注意力矩阵数据时间同步二维卷积神经网络逻辑分层特征提取

系统为您推荐了相关专利信息

基于语义指导的零样本泛化三维物体重建方法

三维物体重建方法隐式结构大语言模型多视角三维结构

基于无人机的同塔多回输电线路感应电的建模系统

高空输电线路感应电建模系统无人机平台地面监控

一种融合大小模型的智能巡检盯防系统及盯防方法

关键帧异常事件视频分析支持用户对视频施工现场

一种基于AIGC的可定制化文创包装设计系统

设计系统包装数据输入模块生成对抗网络数据库构建方法

一种基于多模态识别的智能费用报销审核系统

多模态数据采集财务信息化技术多模态特征协方差矩阵注意力机制

一种基于多模态大模型的数字人交互方法及系统

站点导航

APP 下载