一种基于生成式模型的领域语料数据审核及自动修正方法

正文

推荐专利

申请号：CN202510137831

申请日期：2025-02-07

公开号：CN120012764B

公开日期：2025-09-16

类型：发明专利

摘要

本发明属于人工智能技术领域，提供了一种基于生成式模型的领域语料数据审核及自动修正方法，旨在解决领域语料数据审核依赖专家、效率低下及主观影响问题。技术方案包括：对原始语料预处理，通过LLM进行标准化、分类、修正和重组；利用多个LLM生成观点，进行聚类分析，计算语义熵以评估事实正确性，并评分分类；对中分语料进行人工审核，不合格语料自动修正；循环审核直至合格，并收集反馈更新LLM。该方法减少人工依赖，增强模型自我审查和更新能力，实现自动化修正，提升多领域语料审核的准确性和效率。本发明方法可应用于教育、医疗、金融、法律等不同领域，以提高领域语料数据审核的准确性和效率。

技术关键词

修正方法观点语义向量模糊识别技术多轮对话 sigmoid函数模块审核模型数据大语言模型人工智能技术格式单轮对象条目仓库度量文本关键词

系统为您推荐了相关专利信息

包裹堆匹配方法、装置、设备及存储介质

关键词语义向量包裹文本匹配设备

一种基于模态鉴别器的细粒度敏感信息识别方法

敏感信息识别方法图片 BERT模型识别敏感信息二分类器

一种基于多模态大语言模型的光学邻近效应修正方法及系统

光学邻近效应修正方法大语言模型掩模图案多模态仿真数据

就医风险检测的方法、装置、设备及计算机存储介质

关键词标签聚类风险表格

基于多模态数字孪生的智慧港口物流能源调度方法

能源调度方法语义注意力多模态语义向量感知特征

一种基于生成式模型的领域语料数据审核及自动修正方法

站点导航

APP 下载