摘要
本申请提供了一种文本图像检索模型训练方法、系统、设备及存储介质,应用于医疗图像检索技术领域,其中方法包括对待处理视频进行多级跨模态对齐关系提取;对待处理视频中连续画面帧进行高斯加噪,将高斯加噪后的画面帧切割成若干个图像块;将当前图像块对应的图像块特征、当前图像块对应前一帧图像块的时间序列特征、以及当前图像块对应的时空位置编码特征作为输入特征对图像编码器进行训练;对多级跨模态对齐关系对应的正负样本进行编码,将生成的文本编码特征和图像编码特征映射至同一语义空间,对文本图像检索模型的参数进行优化,从而提高检索模型的召回率,确保检索结果的准确率,为医疗决策和医学研究提供可靠的视频信息支持。
技术关键词
编码特征
图像检索模型
图像编码器
图像块特征
时间序列特征
视频
文本编码器
跨模态
画面
关系
样本
实体
图像检索技术
语义
参数
系统为您推荐了相关专利信息
状态预测方法
统计特征提取
多模态
特征数据信息
模态特征
疾病风险预测方法
Cox比例风险模型
疾病风险预测模型
时间序列模型
LSTM模型
环境感知数据
融合特征
共享单车调度方法
分层强化学习
动态变化特征
智能漏电监测
漏电传感器
微控制器单元
电流传感器
监测模块
图像生成模型
内容生成方法
图像全局特征
会话
语义特征