摘要
本发明公开了一种基于深度学习的文本洗稿检测方法,包括:S1、通过BERT模型对输入文本进行特征编码;S2、通过对上述步骤提取的洗稿文本特征进行分组融合,得到更高质量的洗稿文本特征表示;S3、通过对上述步骤中所述文本特征进行多语句特征融合,整合多视角上下文信息,捕捉深层次文本语义特征;S4、通过三元组损失和正例增强损失函数优化神经网络模型;S5、通过数据集生成模块基于对比学习思想设计并构建洗稿检测数据集。根据本发明,所述方法对润色洗稿和多轮翻译洗稿具有良好的鲁棒性,在高效提取文本特征的同时,准确检测文本洗稿行为,适用于文本洗稿检测与版权保护的领域。
技术关键词
文本
BERT模型
损失函数优化
矩阵
语句
sigmoid函数
神经网络模型
语义特征
多视角
三元组
缩放参数
数据
编码向量
样本
翻译器
增强子
思路
鲁棒性
系统为您推荐了相关专利信息
关键运行参数
联合循环机组
运维策略
大语言模型
运维系统
结构振动响应
堆垛机结构
预测模型构建方法
历史数据特征
健康状态信息
特征点
桥梁病害
图像配准方法
坐标系
图像边缘特征