文本信息的生成方法、模型训练方法、装置及电子设备

正文

推荐专利

申请号：CN202410868476

申请日期：2024-06-28

公开号：CN118587729A

公开日期：2024-09-03

类型：发明专利

摘要

本公开提供了文本信息的生成方法、模型训练方法、装置及电子设备，涉及人工智能技术领域，尤其涉及计算机视觉、深度学习、大模型等技术领域，可应用于光学字符识别和人机交互场景。该文本信息的生成方法的具体实现方案为：提取待处理图像的多尺度图像特征，其中，待处理图像的内容包括文本；多尺度图像特征包括用于表征文本的结构信息和内容信息的特征；基于注意力机制，对多尺度图像特征进行处理，得到与文本相匹配的目标图像特征；以及基于文本生成指令，对目标图像特征进行处理，生成与文本生成指令对应的目标文本信息。

技术关键词

文本样本生成指令像素块图像多尺度查询特征大语言模型子模块特征提取模块交叉注意力机制预训练模型标签处理单元矩阵生成方法参数

系统为您推荐了相关专利信息

一种政务云商用密码违规行为检测方法及系统

商用密码节点政务聚类标识

根据用户问题召回军事文档的对比学习训练方法及系统

学习训练方法样本文档关键词查询特征查询关键词

计算引擎的参数调优方法、设备以及存储介质

参数调优方法自然语言模型内存样本编码器

基于跨模态的文本语义增强识别方法及其相关设备

语义跨模态文本编码器识别方法视觉特征

基于多源信息融合的轨道交通线路高精度定位装置和方法

编码器多源信息融合移动装置二维码高精度定位装置

文本信息的生成方法、模型训练方法、装置及电子设备

站点导航

APP 下载