摘要
本发明涉及一种基于深度学习的多轮对话智能体系统及其控制方法,该系统包括:多模态输入模块获取文本、语音或图像数据;上下文编码模块通过Transformer编码器融合多模态特征生成历史向量;动态状态跟踪模块结合领域知识图谱的交叉注意力机制动态更新对话状态;意图‑响应联合生成模块通过微调BERT模型识别意图,并基于多任务生成模型生成响应;多模态输出模块输出文本、语音或图像;在线学习模块依据用户反馈增量更新参数。系统支持轻量级领域迁移,实现多轮上下文理解准确率≥92%、意图识别准确率≥95%、响应相关性≥4.5/5,领域迁移后任务完成率≥88%,可应用于智能客服与虚拟助手场景。本发明还涉及该系统的控制方法。
技术关键词
多轮对话
智能体系统
编码模块
图谱
意图识别
文本
智能体控制方法
多任务
融合多模态信息
融合多模态特征
输入模块
增量更新
交叉注意力机制
编码器
动态更新
语音
BERT模型