多模态对话处理方法、装置、电子设备及存储介质

AITNT
正文
推荐专利
多模态对话处理方法、装置、电子设备及存储介质
申请号:CN202510353021
申请日期:2025-03-24
公开号:CN120296120A
公开日期:2025-07-11
类型:发明专利
摘要
本申请提供多模态对话处理方法、装置、电子设备及存储介质,涉及人工智能技术领域。该方法包括:获取用户输入的多模态的对话信息;获取与用户对话的角色设定信息与历史对话信息;根据角色设定信息、历史对话信息及对话文本信息,确定用户的对话状态信息;将对话状态信息输入至预先训练得到的大语言模型,得到大语言模型输出的决策结果;根据回复信息的类型、回复信息对应的提示词,生成并输出多模态的目标对话回复信息。即本方案支持多模态对话信息的输入/输出,并基于对话状态信息对用户的对话意图进行更加准确的理解,使得生成的决策结果更具拟人化的效果,提高了用户与人物角色对话时的自由度和沉浸感。
技术关键词
多模态对话 大语言模型 文本生成模型 图片 机器可读指令 决策 电子设备 处理器 音频 人工智能技术 记忆 语义 可读存储介质 模块 意图 计算机 数据
系统为您推荐了相关专利信息
1
UI自动化测试方法、装置、介质和系统
大语言模型 UI自动化测试 页面组件 文本 脚本
2
基于隐式多模态引导对齐的扩散生成方法
扩散生成方法 大语言模型 多模态 文本 指令
3
勘探开发结构化数据查询与可视化方法、系统、介质及设备
可视化方法 大语言模型 语句 图谱 自然语言
4
基于大语言模型的自动驾驶车辆路径规划方法、装置、设备及介质
激光雷达点云数据 车辆路径规划方法 交通 大语言模型 自然语言
5
多模态模型的训练方法、文本生成方法及装置
大语言模型 图像特征向量 多模态 样本 文本生成方法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号