一种文本生成方法、装置及相关设备

AITNT
正文
推荐专利
一种文本生成方法、装置及相关设备
申请号:CN202411052435
申请日期:2024-08-01
公开号:CN119067178A
公开日期:2024-12-03
类型:发明专利
摘要
本申请提供一种文本生成方法、装置及相关设备,涉及人工智能的技术领域,所述方法包括:对待预测图像进行编码,得到图像特征;根据所述图像特征对关联所述待预测图像的非图像特征进行计算,得到第一注意力信息,以及根据所述非图像特征对所述图像特征进行计算,得到第二注意力信息,所述非图像特征用于表示所述待预测图像的上下文语境;对所述第一注意力信息和所述第二注意力信息进行融合,得到目标注意力信息;对所述目标注意力信息进行解码,得到预测文本。本申请通过图像特征和用于描述图像上下文语境的非图像特征的双向交互,可获得更加准确的注意力信息,进而得以输出贴合待预测图像的图像内容的预测文本。
技术关键词
视觉特征 图像 文本生成方法 语义特征 语义注意力 解码器 文本生成装置 数据 处理器 可读存储介质 计算机程序产品 音频特征 注意力机制 解码模块 编码模块
系统为您推荐了相关专利信息
1
一种可识别位置角度的仓库货位检测方法
搬运机器人 仓库货位 坐标系 相机 图像像素
2
一种卷烟条盒胶点的图像检测系统
视觉采集装置 图像检测系统 PLC控制器 工控机 卷烟
3
医学图像处理方法、装置、电子设备及存储介质
甲状腺超声图像 医学图像处理方法 图像处理模型 轮廓区域 医学图像处理装置
4
一种多模态试题知识点标注方法,系统、设备和存储介质
文本特征向量 图像特征向量 知识点标注方法 知识点标签 特征提取网络
5
烟叶病虫害识别方法和系统
病虫害 多模态特征融合 融合特征 烟叶图像 农业设备
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号