文本数据处理方法及装置、文本数据检测方法及装置

正文

推荐专利

申请号：CN202411739848

申请日期：2024-11-29

公开号：CN119621984B

公开日期：2025-10-31

类型：发明专利

摘要

本发明涉及对比学习领域，特别涉及一种文本数据处理方法及装置、文本数据检测方法及装置，所述方法包括将多个领域的人造文本输入大模型工具按照启发式规则分别得到对应的AIGC文本，组成检测增强文本对，并通过多层级的编码器网络和对应多层级的辅助编码网络分别对检测增强文本对中的文本进行编码，并使用多层级知识保护对比学习损失函数优化编码器模型。本发明使编码器模型能够同时对多个领域的文本数据进行无领域语义混淆的高精度文本AIGC检测并能在保持原始知识分布细微变化的情况下拉开人造文本与AIGC文本之间的语义分布，实现插件式的检测领域拓展与检测精度增强。

技术关键词

编码向量文本数据处理方法编码器层级低秩编码启发式规则数据检测方法网络语句文本数据处理装置语义数据检测装置损失函数优化矩阵模块处理单元线性

系统为您推荐了相关专利信息

矿热炉电极长度测量方法及系统

门控循环神经网络注意力机制矿热炉电极长度神经网络单元归一化模块

一种基于数字孪生和大数据的建筑安全预测方法

分类器模型特征提取模型数据参数神经网络算法

一种无缝线路钢轨纵向位移检测方法及设备

集中控制模块位移检测方法位移检测设备相机模块无缝线路钢轨

基于演变虚拟净负荷的电力系统日前优化调度方法

日前优化调度方法抽水蓄能机组新型电力系统水电机组负荷

整流二极管芯片的生产方法

模式特征向量整流二极管芯片化工编码向量高温氧化炉

文本数据处理方法及装置、文本数据检测方法及装置

站点导航

APP 下载