一种多模态对话状态追踪方法

正文

推荐专利

一种多模态对话状态追踪方法

申请号：CN202411102291

申请日期：2024-08-12

公开号：CN119025647A

公开日期：2024-11-26

类型：发明专利

摘要

一种多模态对话状态追踪方法，本发明涉及自然语言处理在任务型对话领域，其旨在解决利用文本与图像的多种模态信息来追踪和预测对话状态多模态信息利用及融合不充分，缺乏先验知识技术问题。本发明方法主要包括场景筛选，利用文本模态信息筛选图像切片；模式图初始化，文本视觉先验知识初始模式图，并进行初步融合；隐藏向量计算，将对话上下文及筛选后的上下文经由模式图计算得到用于预测状态的隐藏向量；对话状态预测，将各模式图的隐藏向量融合后，预测对话状态及对话意图。本发明用于提供对话状态预测方法。

技术关键词

多模态对话追踪方法文本卷积神经网络融合图像编码器生成场景图像切片状态预测方法预训练语言模型节点多模态信息维基百科预训练模型意图分类器自然语言

系统为您推荐了相关专利信息

一种基于Agent的高校主页信息异动监控统计方法及系统

监控统计方法高等院校文本深度语义模型精确地识别

基于跨模态对比学习和描述增强的街景图像地理定位方法及系统

图像地理定位方法街景图像编码器跨模态查询特征

一种线上服务监控方法、装置和介质

服务监控方法大语言模型自然语言分析文本服务监控装置

一种甲状腺病理图像多模态检索系统

图像多模态样本文本编码器检索系统特征向量空间

一种基于扩散模型的文本编辑人脸图像属性的方法

预训练模型噪声预测编辑人脸身份残差注意力机制

一种多模态对话状态追踪方法

站点导航

APP 下载