基于文生图模型的语义对齐方法、装置、设备及介质

正文

推荐专利

申请号：CN202510722352

申请日期：2025-05-30

公开号：CN120653999A

公开日期：2025-09-16

类型：发明专利

摘要

本发明涉及人工智能技术领域，可应用于金融科技、医疗健康等业务系统平台中，公开了一种基于文生图模型的语义对齐方法、装置、设备及介质，包括：获取文本训练集，对文本进行语义增强，得到增强文本内容，提取增强文本内容对应的全局语义特征向量；利用分词器将增强文本内容转换为标记序列；对标记序列进行索引映射，得到目标输入标识，并生成对应的注意力掩码；利用编码器对目标输入标识进行编码，得到标记级向量矩阵；根据注意力掩码对标记级向量矩阵进行自注意力处理，得到细粒度语义特征向量；根据细粒度语义特征向量和全局语义特征向量生成指导信息，利用指导信息得到对齐语义。本发明可以提升文生图模型中文本与图像语义对齐的准确性。

技术关键词

对齐方法标记注意力矩阵图文标识细粒度特征文本编码器索引序列转换模块编码向量语义特征提取视觉融合特征训练集可读存储介质

系统为您推荐了相关专利信息

基于远程塔台场景的管制员语音疲劳预测方法

疲劳预测方法 GRU模型语音信号提取塔台实时语音

基于crossformer算法的极端天气下光伏出力短期预测方法及系统

光伏出力短期预测方法 Pearson相关系数天气特征协方差矩阵气象

一种联邦学习中基于动态马氏距离的模型权重分配方法及系统

客户端权重分配方法参数协方差矩阵动态

基于人工智能的网络数据传输管理方法及系统

网络节点数据包特征传输路径数据流特征探针

一种多目标雷达跟踪方法、装置、电子设备及存储介质

雷达跟踪方法分群关联算法航迹管理扩展卡尔曼滤波

基于文生图模型的语义对齐方法、装置、设备及介质

站点导航

APP 下载