跨模型裁决的大语言模型偏见消减方法及系统

正文

推荐专利

申请号：CN202510943528

申请日期：2025-07-09

公开号：CN120806096A

公开日期：2025-10-17

类型：发明专利

摘要

本发明公开了一种跨模型裁决的大语言模型偏见消减方法及系统，给定一组多个不同的LLM模型，将预设提示分别输入至不同的LLM模型，得到每个LLM模型生成的响应；基于复合偏见度量标准，利用每个LLM模型评估同行组中所有其他LLM模型生成的响应的偏见水平，并得到偏见评估分数；基于得到偏见评估分数，利用改进的波达计数机制计算每个响应的波达分数，将具有最高波达分数的响应选取为集体认同的偏见最少的共识目标响应；基于得到的低偏见的共识目标响应，对每个参与的LLM模型进行参数微调。本发明借鉴人类同行评审和协作学习的理念，提出了新颖的跨模型裁决框架，用于检测和消减LLM中的偏见。

技术关键词

消减方法度量消减系统机制参数模型更新词语矩阵概念模块序列意图观点术语语义蒸馏文本核心噪声人类

系统为您推荐了相关专利信息

基于螺旋式速冻机的化霜控制方法

结霜厚度螺旋式速冻机分析模块监测单元蒸发器

一种四元数LI-EKF的机器人姿态估计方法

姿态估计方法协方差矩阵雅可比矩阵机器人状态更新

一种辅助驾驶系统更新方法、装置、设备及介质

辅助驾驶系统更新方法轨迹偏差数据规划速度

张量计算方法、电子设备、存储介质及产品

计算方法内核尺寸电子设备可读存储介质

基于条件扩散模型的可见光图像海上船舶目标识别方法

可见光图像识别方法噪声标签船舶噪声预测

跨模型裁决的大语言模型偏见消减方法及系统

站点导航

APP 下载