摘要
本申请涉及语音语义技术领域,可应用于金融业务领域和医疗业务领域,公开了一种大语言模型的应答性能指标确定方法、装置、设备及介质,所述方法包括从预设问答文本数据库中获取预设数量的预设问题文本以及标准应答文本;根据LLM问答机器人和各预设问题文本,生成待验证应答文本;通过各标准应答文本对各待验证应答文本进行至少一项应答性能测试,确定LLM问答机器人的各项应答性能指标。通过上述方式,本申请通过从数据库获取预设问题文本及标准应答文本,自动化生成待验证应答文本并进行性能测试,减少了人工操作,多维度性能测试全面考核了大语言模型的性能,在金融业务领域和医疗业务领域中,提高了大语言模型的语义理解准确性。
技术关键词
问答机器人
文本
性能测试脚本
大语言模型
抗噪声
指标
语音语义技术
噪声信息
资源
计算机设备
可读存储介质
存储计算机程序
生成噪声
关键词
处理器
存储器
基准
系统为您推荐了相关专利信息
敏感信息识别方法
图片
BERT模型
识别敏感信息
二分类器
智能审核系统
依存句法分析
大语言模型
一致性检测
理赔案件
样本检测系统
词嵌入向量
判别模块
交叉注意力机制
生成模板