一种基于自然语言理解的多模态大语言模型对话生成方法

AITNT
正文
推荐专利
一种基于自然语言理解的多模态大语言模型对话生成方法
申请号:CN202510071190
申请日期:2025-01-16
公开号:CN119989268A
公开日期:2025-05-13
类型:发明专利
摘要
本发明适用于人工智能技术领域,提供了一种基于自然语言理解的多模态大语言模型对话生成方法,包括以下步骤:通过多模态大型语言模型接收用户输入的多模态信息,所述多模态信息包括若干个模态数据;对多模态信息中的模态数据进行预处理,提取得到多模态特征;基于多头注意力机制的动态加权融合策略,将提取的多模态特征进行统一的融合特征表示;基于长上下文处理算法来确定长上下文的对话状态,确保生成的回复内容与对话历史相关联;根据统一的融合特征表示和对话状态,通过RAG检索增强生成技术生成自然语言进行回复。本发明能够处理并理解多种模态的输入,提高了对用户意图的理解能力,且维护上下文的连贯性,生成的回复更加自然。
技术关键词
对话生成方法 自然语言理解 大语言模型 多模态信息 融合特征 多模态特征 生成自然语言 多头注意力机制 梅尔频率倒谱系数 生成技术 数据 融合策略 识别用户意图 编码器 多任务 权重机制 词袋模型 表情特征
系统为您推荐了相关专利信息
1
基于大模型思维链的情境图像生成方法及装置
图像生成方法 图像生成模型 大语言模型 音频编码器 音乐特征
2
一种基于大模型的可解耦的多模态遥感影像要素提取方法、系统、设备以及存储介质
遥感影像特征 特征提取器 模型预训练 特征提取模块 分支
3
一种多输入中文拼写纠错方法、系统、电子设备及介质
大语言模型 拼写纠错方法 输入中文 模板 生成提示词
4
一种基于多模态融合的驾驶风格分类方法和装置
驾驶风格分类 时间序列特征 车辆 融合特征 运动
5
基于多模态大模型的自动驾驶模型、训练和自动驾驶方法
文本 视觉 视频编码数据 自动驾驶方法 自动驾驶装置
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号