摘要
本发明属于人工智能技术领域,提供了一种基于生成式模型的领域语料数据审核及自动修正方法,旨在解决领域语料数据审核依赖专家、效率低下及主观影响问题。技术方案包括:对原始语料预处理,通过LLM进行标准化、分类、修正和重组;利用多个LLM生成观点,进行聚类分析,计算语义熵以评估事实正确性,并评分分类;对中分语料进行人工审核,不合格语料自动修正;循环审核直至合格,并收集反馈更新LLM。该方法减少人工依赖,增强模型自我审查和更新能力,实现自动化修正,提升多领域语料审核的准确性和效率。本发明方法可应用于教育、医疗、金融、法律等不同领域,以提高领域语料数据审核的准确性和效率。
技术关键词
修正方法
观点
语义向量
模糊识别技术
多轮对话
sigmoid函数
模块
审核模型
数据
大语言模型
人工智能技术
格式
单轮
对象
条目
仓库
度量
文本
关键词
系统为您推荐了相关专利信息
敏感信息识别方法
图片
BERT模型
识别敏感信息
二分类器
光学邻近效应修正方法
大语言模型
掩模图案
多模态
仿真数据
能源调度方法
语义注意力
多模态
语义向量
感知特征