摘要
本公开属于人工智能技术领域,涉及一种几何大模型训练方法、应用方法、装置、介质及电子设备。该方法包括:获取几何图像,几何图像是利用几何形式语言重建得到的;根据几何图像确定几何文本,并利用几何图像和几何文本训练几何大模型得到满足预设条件的几何大模型,几何文本包括与几何图像对应的几何问题文本和几何答案文本,几何大模型用于进行几何问题求解。本公开降低了重建过程中的算力,解决了几何图像的顶点注释和拓扑结构的一致性问题以及重建图像和结合文本的匹配度问题,提升了几何视觉感知能力,整合了拓扑关系感知和几何公理对齐两种方案,优化了几何大模型在几何推理和感知任务中的泛化能力和推理深度,提升了计算效率和计算准确率。
技术关键词
模型训练方法
字典
文本
模型训练装置
大语言模型
答案
模型训练模块
顶点
参数
基底
图像重建
关系
多层感知器
计算机程序指令
电子设备
坐标
图像搜索
人工智能技术
编辑
系统为您推荐了相关专利信息
模型生成方法
文本
高分辨率纹理
视觉特征提取
图像编码器
语义理解模型
自动化方法
视觉
非易失性存储介质
文本识别