摘要
本申请提供了一种文本标注方法、装置、设备、存储介质及计算机程序产品;方法包括:获取待标注的文本集,并将文本集分成多组子文本集;针对每组子文本集,识别子文本集中各文本的属性,并将子文本集中与预设目标属性的匹配度最大的文本标记为第一文本,以及将与预设目标属性的匹配度最小的文本标记为第二文本;针对待标注的文本集中的每一待标注的文本,基于文本在多组子文本集中出现的第一总次数、文本在不同子文本集中被标记为第一文本的第二总次数,以及文本在不同子文本集中被标记为第二文本的第三总次数,确定文本与预设目标属性的第一匹配度,并对文本进行匹配度标注。通过本申请,能够实现文本连续值属性的自动化标注。
技术关键词
大语言模型
文本标注方法
本子
标记
样本
计算机程序产品
标注装置
标签
模块
系统为您推荐了相关专利信息
联邦学习模型
性能评估方法
后门
构建测试数据
参数
优化粒子群算法
粒子群算法求解
静态障碍物
栅格
坐标
自然语言转换
工作流
语言模块
人工智能体技术
语言转换功能