基于内嵌稀疏门专家混合模型的图文跨模态检索方法

AITNT
正文
推荐专利
基于内嵌稀疏门专家混合模型的图文跨模态检索方法
申请号:CN202511485569
申请日期:2025-10-17
公开号:CN120950724A
公开日期:2025-11-14
类型:发明专利
摘要
本发明属于跨模态图文检索技术领域,公开了基于内嵌稀疏门专家混合模型的图文跨模态检索方法,包括以下步骤:跨模态多尺度建模:利用空洞空间金字塔池化模块ASPP提取图像的多尺度图像特征,利用多尺度激活因子动态加权文本特征,实现图文跨模态多尺度语义对齐;多尺度跨模态特征融合:设计多尺度跨模态路由器,通过交叉注意力融合图像与文本特征,并通过专家网络分尺度提取跨模态联合特征;双路三元组损失计算:采用双路三元组损失函数,结合尺度内与跨尺度约束优化特征空间,实现多尺度与跨模态层面的联合优化,得到最终的跨模态检索结果。通过本发明提高跨模态图文检索的精度和效率。
技术关键词
三元组损失函数 空间金字塔池化 跨模态图文检索 文本 交互特征 图像多尺度 语义 模态特征 生成多尺度 空洞 交叉注意力机制 因子 路由器
系统为您推荐了相关专利信息
1
一种跨境数据的评估方法及装置
关键词 文本生成器 数据 摘要 语句
2
文本数据的处理方法、装置及计算机设备
实体 非结构化文本 对象 序列 图谱
3
一种结合嵌入方法和大语言模型的知识图谱补全方法
知识图谱补全方法 嵌入方法 大语言模型 实体 多层感知机
4
基于大模型知识库的集成式检索对话方法、系统及介质
对话方法 对话系统 可读存储介质 样本 分词
5
一种基于优化财税大模型飞轮进行需求响应的方法及系统
财务 服务系统 采样率 数据分布 飞轮
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号