文本信息的生成方法、模型训练方法、装置及电子设备

AITNT
正文
推荐专利
文本信息的生成方法、模型训练方法、装置及电子设备
申请号:CN202410868476
申请日期:2024-06-28
公开号:CN118587729A
公开日期:2024-09-03
类型:发明专利
摘要
本公开提供了文本信息的生成方法、模型训练方法、装置及电子设备,涉及人工智能技术领域,尤其涉及计算机视觉、深度学习、大模型等技术领域,可应用于光学字符识别和人机交互场景。该文本信息的生成方法的具体实现方案为:提取待处理图像的多尺度图像特征,其中,待处理图像的内容包括文本;多尺度图像特征包括用于表征文本的结构信息和内容信息的特征;基于注意力机制,对多尺度图像特征进行处理,得到与文本相匹配的目标图像特征;以及基于文本生成指令,对目标图像特征进行处理,生成与文本生成指令对应的目标文本信息。
技术关键词
文本 样本 生成指令 像素块 图像 多尺度 查询特征 大语言模型 子模块 特征提取模块 交叉注意力机制 预训练模型 标签 处理单元 矩阵 生成方法 参数
系统为您推荐了相关专利信息
1
一种政务云商用密码违规行为检测方法及系统
商用密码 节点 政务 聚类 标识
2
根据用户问题召回军事文档的对比学习训练方法及系统
学习训练方法 样本 文档关键词 查询特征 查询关键词
3
计算引擎的参数调优方法、设备以及存储介质
参数调优方法 自然语言模型 内存 样本 编码器
4
基于跨模态的文本语义增强识别方法及其相关设备
语义 跨模态 文本编码器 识别方法 视觉特征
5
基于多源信息融合的轨道交通线路高精度定位装置和方法
编码器 多源信息融合 移动装置 二维码 高精度定位装置
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号