摘要
本申请公开了一种模型样本的质量评估方法、装置、存储介质和计算机设备。方法包括:将样本数据输入人工智能生成内容检测模型,获取样本数据的命中概率;基于样本数据的属性信息匹配内容评估体系;基于内容评估体系中评价规则对样本数据进行处理,确定样本数据相对于至少一个预设评价指标的测试值;基于与命中概率和预设评价指标对应的目标权重,对命中概率和测试值进行权重计算,得到样本数据的质量评分。本申请的方法能够过滤了那些由AI生成但可能误导模型训练的数据,还显著提升了样本数据集的纯净度和可信度,还能够实现对训练数据的多维度、高精度评估,满足不同的任务需求,提升基于样本数据训练的模型的泛化能力和对未知数据的适应能力。
技术关键词
样本
内容评估
指标
计算机设备
人工智能模型
主题
处理器
评估装置
文本
自然语言
匹配模块
数据格式
语义
可读存储介质
程序
算法
节点
水印
系统为您推荐了相关专利信息
驾驶员监控系统
多模态控制方法
人脸特征信息
多模态控制系统
娱乐主机
虚拟现实交互
行走式
评估系统
数据处理单元
测试场景