摘要
本申请公开了一种用于机器学习数据集的偏见检测及可视化分析方法、系统和计算机程序产品,包括:接收机器学习数据集,其中,所述机器学习数据集包含多个训练样本;提取所述机器学习数据集中的至少一个属性;对所述机器学习数据集的至少一个属性中的每个特定属性,执行以下步骤:计算所述机器学习数据集的特定属性在指定条件的偏见程度;以及在可视分析页面显示所述特定属性、所述指定条件、以及所述偏见程度。该方法能够在大规模、多样化的数据集中高效识别和分析基于属性的偏见,同时能够通过可视化方式直观展示检测到的偏见,便于用户理解和后续消除偏见,从而在决策模型中消除决策偏见,提高决策准确度。
技术关键词
分析页面
树状结构
计算机程序指令
多模态分类器
可视化分析方法
文本主题模型
文本摘要模型
计算机程序产品
可视化方式
处理器
冗余
决策
数据分布
自然语言
节点
存储器
系统为您推荐了相关专利信息
仿真机器人
行走控制方法
指标
成分分析方法
关节力矩
服务器
密码资源池
构建分类模型
计算机程序指令
聚类
RPA机器人
系统运行状况
巡检机器人
巡检方法
多系统