多模态语言模型的训练方法和使用方法

AITNT
正文
推荐专利
多模态语言模型的训练方法和使用方法
申请号:CN202410916790
申请日期:2024-07-10
公开号:CN118469039B
公开日期:2024-10-01
类型:发明专利
摘要
本发明提供一种多模态语言模型的训练方法和使用方法,包括:将预先采集的样本数据集基于类别进行编码与拼接,得到模型词典和拼接文本;根据模型词典、拼接文本得到词典索引矩阵B;将B与当前语言模型中的嵌入矩阵E相乘,得到嵌入向量;基于嵌入向量的上下文信息对当前语言模型的嵌入层、隐藏层和输出层的参数权重进行修正,得到修正后语言模型;将嵌入向量输入至修正后语言模型,得到预测tokens及其概率;计算预测tokens和样本答案的tokens之间损失L;若L大于预设的损失阈值,则重复以上步骤;否则,则将修正后语言模型作为训练好的多模态语言模型。本多模态语言模型可以同时精确识别自然语言和多媒体语言。
技术关键词
词典 样本 文本 索引 多模态 识别自然语言 矩阵乘法运算 图像处理模型 答案 语音 数据 分词 多媒体 参数 编码 代表 金融
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号