摘要
本公开提供了样本筛选方法、装置、设备及存储介质,本公开涉及数据处理技术领域,尤其涉及深度学习、模型训练技术领域。具体实现方案为:根据目标资源的文本字数和图片数量,确定所述目标资源的预估播放时长;根据所述目标资源的文字敏感度和图片敏感度,调整所述目标资源对应分桶的参考阈值,以得到划分阈值;根据所述预估播放时长和所述划分阈值,确定所述目标资源的样本类型。根据本公开实现细粒度阅读时长预估,保障训练样本划分的科学性。
技术关键词
图片
样本筛选方法
文本
模型训练技术
资源库
参数
多项式
数据处理技术
计算机程序产品
筛选装置
处理器通信
指令
可读存储介质
存储器
线性
动态
系统为您推荐了相关专利信息
文本翻译模型
文本翻译方法
样本
语句
大语言模型
训练优化方法
神经网络架构
文本
特征提取算法
多模态交互
深度学习模型
卷积神经网络模型
积层
控制策略
温控