一种基于多模态大模型的交互方法、系统、设备及介质

正文

推荐专利

申请号：CN202510352943

申请日期：2025-03-25

公开号：CN119884691B

公开日期：2025-06-20

类型：发明专利

摘要

本发明提供了一种基于多模态大模型的交互方法、系统、设备及介质，涉及多模态大模型技术领域，本方法包括：获取实时输入信息集；对实时输入信息集分别进行处理，得到处理数据，处理数据包括第一处理信息、第二处理信息及第三处理信息，其中对实时视频信息进行处理得到第一处理信息，对实时音频信息进行处理得到第二处理信息，对实时文本信息进行处理得到第三处理信息；通过预设模态关联模型对处理数据进行关联计算；根据关联损失信息对处理数据进行拼接处理，得到拼接数据集；对拼接数据集进行解码输出，得到交互响应数据，交互响应数据用于反馈交互信息。本方法解决了对实时输入数据实现跨模态间的关联，方便扩展到更加复杂的多模态组合。

技术关键词

实时音频信息文本交互方法多模态实时视频数据关键帧标记序列拼接模型可读存储介质解码模型存储计算机程序投影模型交互设备交互系统拼接模块

系统为您推荐了相关专利信息

基于边缘计算的多源数据融合型智能数据管理系统

融合型智能数据管理系统多模态数据采集静态特征多源异构数据

一种基于扩散模型可推广的布局到图像生成方法

注意力地图布局特征图像生成方法语义噪声图像

一种智能模拟面试的处理方法、系统及介质

大语言模型阶段生成智能资源分配模型库

保险业务中续保任务分配方法、装置、设备和介质

任务分配模型数据样本神经网络模型任务分配方法

高分辨率海上风速二维分布场预报方法及系统

二维卷积神经网络预报方法多头注意力机制气象风场

一种基于多模态大模型的交互方法、系统、设备及介质

站点导航

APP 下载