一种基于阅读理解的违规数据检测方法

正文

推荐专利

一种基于阅读理解的违规数据检测方法

申请号：CN202411946843

申请日期：2024-12-26

公开号：CN119884368B

公开日期：2025-09-23

类型：发明专利

摘要

本发明公开了一种基于阅读理解的违规数据检测方法，涉及自然语言处理和人工智能技术领域。包括：获取包含仇恨言论的多模态数据，多模态数据包括语音数据和文本数据；利用语音识别系统将语音数据转换为文本数据，得到文本内容；利用大语言模型的思维链提示生成文本内容的逐步推理解释，根据文本内容的逐步推理解释得到初步预测类别标签；基于得到的文本内容的逐步推理解释，再次利用大语言模型生成最终预测类别标签；根据最终预测类别标签生成训练数据；利用训练数据对违规文本分类模型进行训练，得到训练后的检测结果。本发明显著提高了对隐晦、复杂违规言论的检测准确性。

技术关键词

数据检测方法大语言模型生成文本内容预测类别文本分类模型语音识别系统自然语言模型生成训练数据标签社交媒体平台多模态爬虫技术人工智能技术框架对象优化器

系统为您推荐了相关专利信息

一种任务推理方法、装置及设备

推理方法节点负载均衡策略大语言模型标识符

实验报告批阅方法、装置、设备及计算机可读存储介质

批阅方法大语言模型文本多模态图片

一种基于LangChain框架的大模型课件自动生成方法

课件内容页面结构自动生成方法大语言模型教育场景

一种短抗菌肽序列的识别方法、系统、终端及存储介质

抗菌肽理化特征序列特征融合特征识别方法

一种基于混合检索增强生成的文本问答方法及系统

关键词大语言模型语句分词噪声数据

一种基于阅读理解的违规数据检测方法

站点导航

APP 下载