基于多模态大模型的数学问题求解方法、装置和电子设备

正文

推荐专利

申请号：CN202510587826

申请日期：2025-05-08

公开号：CN120105355A

公开日期：2025-06-06

类型：发明专利

摘要

本发明提供基于多模态大模型的数学问题求解方法、装置和电子设备，涉及人工智能技术领域。所述方法包括：确定数学问题的数学要素图像；将数学要素图像输入图像编码模型，得到图像编码模型输出的图像向量；图像编码模型基于样本数学要素图像及其对应的正样例文本描述和负样例文本描述训练得到；将图像向量输入自适应模块，得到自适应模块输出的图像转换编码向量；自适应模块基于样本图像向量和样本文本向量训练得到；确定数学问题的题干文字，将题干文字和图像转换编码向量输入大语言模型，得到大语言模型输出的预测解答过程；大语言模型基于样本题干文字、样本图像转换编码向量和样本解答过程训练得到，能够提升多模态大模型的数学问题求解能力。

技术关键词

图像编码文本数学编码向量大语言模型多模态样本非暂态计算机可读存储介质模块求解装置电子设备处理器人工智能技术计算机程序产品字母存储器数值序列

系统为您推荐了相关专利信息

一种基于人工智能的多模态语言学习辅助系统及方法

学习辅助系统跨模态动态场景语法结构文本

一种货物图片检索方法、装置、设备及存储介质

图片检索方法三元组损失函数多模态特征融合文本编码器图像编码器

一种基于通用意图的任务型多轮对话系统增强方法

多轮对话意图识别模型数据可读存储介质终端设备

媒体内容的展示方法、装置、电子设备、存储介质和程序产品

界面组件媒体展示界面展示方法应用程序冷启动

融合图像信息的多模态蒙汉神经机器翻译方法

蒙汉神经机器翻译方法文本生成图像蒙古语融合图像信息图像转换方法

基于多模态大模型的数学问题求解方法、装置和电子设备

站点导航

APP 下载