文本标注方法、装置、设备、存储介质及计算机程序产品

正文

推荐专利

申请号：CN202510064989

申请日期：2025-01-15

公开号：CN120067788A

公开日期：2025-05-30

类型：发明专利

摘要

本申请提供了一种文本标注方法、装置、设备、存储介质及计算机程序产品；方法包括：获取待标注的文本集，并将文本集分成多组子文本集；针对每组子文本集，识别子文本集中各文本的属性，并将子文本集中与预设目标属性的匹配度最大的文本标记为第一文本，以及将与预设目标属性的匹配度最小的文本标记为第二文本；针对待标注的文本集中的每一待标注的文本，基于文本在多组子文本集中出现的第一总次数、文本在不同子文本集中被标记为第一文本的第二总次数，以及文本在不同子文本集中被标记为第二文本的第三总次数，确定文本与预设目标属性的第一匹配度，并对文本进行匹配度标注。通过本申请，能够实现文本连续值属性的自动化标注。

技术关键词

大语言模型文本标注方法本子标记样本计算机程序产品标注装置标签模块

系统为您推荐了相关专利信息

优化后门攻击下的联邦学习模型防御机制性能评估方法

联邦学习模型性能评估方法后门构建测试数据参数

基于河马状态优化粒子群算法的无人机路径规划方法

优化粒子群算法粒子群算法求解静态障碍物栅格坐标

基于AI Agent将自然语言转换为模型工作流的系统及方法

自然语言转换工作流语言模块人工智能体技术语言转换功能

一种基于熵权法与深度强化学习的多目标飞机动态调度方法

动态调度方法参数维修飞机项目熵权法

图像编码方法、设备、存储介质及程序产品

图像编码方法令牌大语言模型文本映射技术

文本标注方法、装置、设备、存储介质及计算机程序产品

站点导航

APP 下载