一种评估大语言模型在建筑领域应用效果的方法及系统

正文

推荐专利

申请号：CN202510265555

申请日期：2025-03-07

公开号：CN120336777A

公开日期：2025-07-18

类型：发明专利

摘要

本发明公开了一种评估大型语言模型在建筑领域应用效果的方法及系统，涉及计算机技术领域，包括以下步骤：S1，构建建筑学知识体系，并整理所述建筑学知识体系的试题集；S2，从所述试题集中抽取测试集，对具有代表性的大语言模型进行稳定性和有效率的初步测试，确定合适的测试集大小；S3，利用所述S2中确定的大小重新抽取测试集，分别用AO与COT方法对各个待测大语言模型进行提问，通过计算这两种方法正确率的均值差异，用配对样本t检验对均值差异进行统计验证得到大型语言模型在建筑领域应用效果的客观结论。本发明可定量分析大语言模型(LLM)在复杂建筑任务中的准确性和稳定性，客观判断LLM对建筑领域的整体优化效果，提升其在建筑领域的应用效果。

技术关键词

大语言模型建筑正确率有效率提问方法处理器样本计算机设备可读存储介质模块答案程序

系统为您推荐了相关专利信息

一种基于人工智能的语音识别方法及装置

语音特征信息语音识别方法文本计算机执行指令金融

基于大语言模型微调的漏洞检测方法

漏洞检测方法大语言模型前馈神经网络注意力机制矩阵

车辆的跟踪检测方法和装置、计算机存储介质、终端设备

跟踪检测方法车辆轨迹标识计算机存储介质

文本数据处理方法、装置、电子设备及非易失性存储介质

文本数据处理方法知识库系统层级大语言模型问答系统

基于BIM的资产模型信息高效赋值一体化平台

一体化平台数据验证 Revit软件房间资产

一种评估大语言模型在建筑领域应用效果的方法及系统

站点导航

APP 下载