一种基于跨模态隐式局部学习的问答推理方法及系统

AITNT
正文
推荐专利
一种基于跨模态隐式局部学习的问答推理方法及系统
申请号:CN202410832864
申请日期:2024-06-26
公开号:CN119026684A
公开日期:2024-11-26
类型:发明专利
摘要
本发明提供了一种基于跨模态隐式局部学习的问答推理方法及系统,涉及自然语言处理技术领域。方法包括:获取训练特征数据集,对训练特征数据集进行配对,得到若干样本,每对样本都由图像、图像对应的问题描述文本和问题对应的答案组成。提取图像的图像特征,对问题描述文本进行掩码得到掩码问题描述文本;使用Transformer编码器对掩码问题描述文本进行特征提取,得到掩码问题描述文本特征。构建跨模态融合模块,将图像特征与掩码问题描述文本特征作为跨模态融合模块的输入,由掩码预测模块预测被掩码替换的字符。计算预测被掩码替换的字符与真实字符的相似度,设计整体优化目标函数对掩码预测模块进行优化。本发明在图像问答、物体识别、行人检索领域均有良好的应用前景。
技术关键词
跨模态 文本 推理方法 字符 训练特征 图像块特征 交叉注意力机制 编码器 模块 特征提取单元 样本 答案 推理系统 多层感知机 序列
系统为您推荐了相关专利信息
1
基于大数据的技术性贸易措施调查问卷的生成方法及系统
关键词 网页流量数据 序列 语义 生成方法
2
一种基于多模态大模型的可视化大屏开发的方法及系统
统一接口网关 可视化大屏 多模态 布局优化算法 支撑模块
3
一种设备语音控制方法、装置、电子设备和存储介质
语音控制指令 设备语音控制方法 自然语言识别 音频特征提取 家居设备控制
4
订单处理方法、系统、设备、存储介质及程序产品
订单 查询意图 意图识别 自然语言文本 参数
5
一种基于CT影像的感染性肾积水诊断装置
感染性肾积水 关键帧 诊断装置 患者 编码特征
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号