摘要
本发明涉及数据处理技术领域,公开了一种基于CRF模型的智能数据打标方法、设备及介质,包括:采集文本数据、语音数据及图像数据;将语音数据转换为目标文本数据,识别文本数据及目标文本数据中的不符合预设规则的内容;对不符合预设规则的内容进行词性标注处理,得到语义标注数据,以及提取图像数据对应的图像特征;将语义标注数据及图像特征合并为数据标注集,根据标注任务需求对CRF模型中的状态特征及转移特征进行特征调整,利用数据标注集对调整后的CRF模型进行参数优化;利用优化后的CRF模型对待标注数据进行打标,得到待标注数据对应的标注类型。本发明可以提高数据打标时的准确性。
技术关键词
数据打标方法
CRF模型
图像标识符
文本
语义
情感类别
分词
词语
样本
语音特征
数据验证
处理器
数据处理技术
关键词
估计算法
参数
系统为您推荐了相关专利信息
漏洞
自定义函数
动态分析功能
动态污点分析
深度学习分析
审核方法
深度学习算法
规则引擎技术
特征值识别
审核规则
决策优化方法
决策树模型
词向量模型
矩阵
累积前景理论
水库群调度
大语言模型
复杂度
变量
水库调度规则