一种基于文本反演的构图理解方法、系统

AITNT
正文
推荐专利
一种基于文本反演的构图理解方法、系统
申请号:CN202510156595
申请日期:2025-02-13
公开号:CN119621943B
公开日期:2025-05-02
类型:发明专利
摘要
本发明公开了一种基于文本反演的构图理解方法、系统,该方法采用基于优化的文本反演算法将输入的图像转换为pseudo‑token,对原始文本与pseudo‑token进行拼接,将拼接后的文本转换为特征向量,计算文本与图像的相似度。本方法在减少对硬负样本依赖的情况下提高构图理解模型的理解能力,提高模型交互效率,同时减少时间消耗。
技术关键词
深度学习模型 理解系统 反演算法 文本编码器 图像编码器 标记 迭代算法 数据输入模块 查找表 特征提取模块 拼接模块 语义 模板 样本
系统为您推荐了相关专利信息
1
翻译方法、视频会议方法及电子设备
解码器 编码器 翻译方法 视频会议方法 对象
2
基于AI数字人的语音音乐创作与演绎系统及方法
演绎系统 演绎方法 数据收集模块 中央控制模块 特征提取模块
3
一种对流层误差修正方法、装置、电子设备及存储介质
误差修正方法 深度学习模型 气象 参数 误差修正装置
4
融合深度学习与多源数据的地质沉降监测方法及系统
地质沉降监测方法 融合深度学习 时空分辨 因子 掩膜
5
一种基于空间结构自动计算左右肺静脉开口夹角的方法与系统
三维医学影像数据 左心房 中心线 空间结构 深度学习模型
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号