摘要
本发明涉及计算机技术领域,公开了一种语言模型构建方法、装置、设备及介质,该方法包括:获取第一图像文本对集合;将第一图像文本对集合输入至预构建的语言模型中进行迭代训练,其中,语言模型包括文本提取器和自注意力机制神经网络子模型;在语言模型中,通过文本提取器提取第一图像文本对集合中第一图像文本对包括的图像特征和多个词向量,其中,第一图像文本对为第一图像文本对集合中的任一个图像文本对;利用图像特征和/或多个词向量对自注意力机制神经网络子模型进行迭代训练,直至自注意力机制神经网络子模型达到迭代停止条件时,停止对语言模型的训练,获取构建好的语言模型。
技术关键词
注意力机制
语言模型构建方法
图像
文本
答案
强化学习模型
样本
矩阵
可读存储介质
数据
表达式
存储器
处理器
指令
计算机设备
元素
关系
因子
数值
系统为您推荐了相关专利信息
智能管理方法
消息通知
智能车辆
多模态
车辆传感器数据
GAN网络模型
检测网络模型
影像
生成方法
超声弹性图像
烟雾检测方法
非易失性计算机可读存储介质
计算机程序指令
烟雾检测设备
烟雾检测装置
脉冲响应函数
地震干涉法
影像记录设备
模态参数识别
三轴云台