文本图像检索模型训练方法、系统、设备及存储介质

AITNT
正文
推荐专利
文本图像检索模型训练方法、系统、设备及存储介质
申请号:CN202510418014
申请日期:2025-04-03
公开号:CN120353963A
公开日期:2025-07-22
类型:发明专利
摘要
本申请提供了一种文本图像检索模型训练方法、系统、设备及存储介质,应用于医疗图像检索技术领域,其中方法包括对待处理视频进行多级跨模态对齐关系提取;对待处理视频中连续画面帧进行高斯加噪,将高斯加噪后的画面帧切割成若干个图像块;将当前图像块对应的图像块特征、当前图像块对应前一帧图像块的时间序列特征、以及当前图像块对应的时空位置编码特征作为输入特征对图像编码器进行训练;对多级跨模态对齐关系对应的正负样本进行编码,将生成的文本编码特征和图像编码特征映射至同一语义空间,对文本图像检索模型的参数进行优化,从而提高检索模型的召回率,确保检索结果的准确率,为医疗决策和医学研究提供可靠的视频信息支持。
技术关键词
编码特征 图像检索模型 图像编码器 图像块特征 时间序列特征 视频 文本编码器 跨模态 画面 关系 样本 实体 图像检索技术 语义 参数
系统为您推荐了相关专利信息
1
一种基于多源数据融合与神经网络增强的奶牛发情状态预测方法
状态预测方法 统计特征提取 多模态 特征数据信息 模态特征
2
基于多维度健康数据分析的无重大疾病风险预测方法
疾病风险预测方法 Cox比例风险模型 疾病风险预测模型 时间序列模型 LSTM模型
3
一种基于视频数据的共享单车调度方法和系统
环境感知数据 融合特征 共享单车调度方法 分层强化学习 动态变化特征
4
一种智能漏电监测电路及监测方法
智能漏电监测 漏电传感器 微控制器单元 电流传感器 监测模块
5
一种基于流式通信的跨模态内容生成方法及系统
图像生成模型 内容生成方法 图像全局特征 会话 语义特征
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号