端到端的影像文件处理方法、模型构建方法及装置

AITNT
正文
推荐专利
端到端的影像文件处理方法、模型构建方法及装置
申请号:CN202511270622
申请日期:2025-09-08
公开号:CN120751140A
公开日期:2025-10-03
类型:发明专利
摘要
本公开涉及一种端到端的影像文件处理方法、模型构建方法及装置,包括:获取待处理的影像文件;将上述影像文件输入到预先构建好的影像报告生成模型进行图像语义编码处理、基于时空注意力机制生成上下文向量和文本序列预测解码处理,输出得到影像报告文本;其中,基于时空注意力机制生成上下文向量,包括:根据图像语义编码处理的结果和文本序列预测解码处理的结果,基于注意力机制,针对不同图像区域的重要程度与每个时间步的文本预测之间的对应关系进行动态映射学习,得到每个时间步针对全局图像的上下文向量;上下文向量是针对图像语义编码处理的结果进行注意力权重加权后得到的。输出的报告具有较高的准确度、处理效率高且模型的泛化性能好。
技术关键词
时空注意力机制 文本 报告 图像 序列 医学影像文件 解码模型 语义特征 模型构建方法 编码 区域卷积神经网络 神经网络模型训练 网络结构 深度卷积神经网络 长短期记忆网络
系统为您推荐了相关专利信息
1
一种用于人形机器人关键部件装配的多模态自适应夹取系统及其控制方法
语义向量 可编程逻辑控制器 夹取模块 可编程逻辑控制模块 夹取系统
2
一种基于电厂数据的智能文档管理方法及系统
智能文档 管理方法 神经网络算法 数据 多层次
3
基于小波变换频域特征的突发事件图像去雾方法
图像去雾模型 无雾图像 去雾图像 图像去雾方法 高频特征
4
一种基于伪孪生去噪网络的中文实体关系联合抽取方法
网络 高维特征向量 序列 实体 依存句法分析
5
一种岩体裂隙三维分形维数计算方法
三维分形维数 计算方法 盒子 图像 矩阵
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号