一种基于大语言模型的文档噪声处理方法、装置、设备及存储介质

正文

推荐专利

申请号：CN202510512522

申请日期：2025-04-23

公开号：CN120296149A

公开日期：2025-07-11

类型：发明专利

摘要

本申请公开了一种基于大语言模型的文档噪声处理方法、装置、设备及存储介质，涉及人工智能技术领域，包括：处理大语言模型处理待识别文档后得到的输出结果，并判断得到的置信度熵值是否大于预设熵值阈值，若不大于，则基于置信度熵值与预设目标熵值的差值确定文档数量，并将文档数量个噪声文档插入至待识别文档的上下文中间位置，得到待处理文档，并评分待处理文档，若评分结果大于预设评分阈值，则利用预设二分类模型处理待处理文档，若得到的陷阱文档概率不大于预设概率阈值，则基于评分结果分组判定待处理文档，并将基于得到的相关组判定结果与初始队列确定的目标队列输入大语言模型。这样能够提高对文档信息的处理效率。

技术关键词

大语言模型检索算法队列陷阱二分类模型多源噪声文本语义关键词标记人工智能技术模式匹配可读存储介质实体处理器数值电子设备答案模块

系统为您推荐了相关专利信息

生鲜果蔬预警方法指标物流预警模型

台架仿真程序队列数字孪生模型关系型数据库

评测方法图像大语言模型数据模板

冷量补偿方法电机电流数据可编程逻辑控制器队列稳态

基于子空间编码和机器学习模型的洞察发现方法及系统

机器学习模型数据随机森林模型查询策略缓存策略

一种基于大语言模型的文档噪声处理方法、装置、设备及存储介质

站点导航

APP 下载