摘要
本申请公开了一种长文本的鉴别方法,包括:获取待鉴别的目标长文本,并将目标长文本中包含的每个词语分别转换成动态词向量,动态词向量根据目标长文本的上下文动态地调整;对于目标长文本中的每个长句,提取长句中每个词语对应的动态词向量的用于体现词语语义特征的词向量特征,并根据每个词语对区分生成式文本和人类文本贡献度的大小,确定长句中每个词语的词向量特征的权重,以获取长句的长句特征;对于目标长文本中的每个文段,根据文段中每个长句对区分生成式文本和人类文本贡献度的大小,确定文段中每个长句的长句特征的权重,以获取文段的文段特征;基于所有文段特征对目标长文本进行鉴别,以确定目标长文本为生成式文本或是人类文本。
技术关键词
文本
词语
鉴别方法
注意力机制
人类
语义特征
特征提取模块
动态地
滑动窗口
鉴别装置
鉴别模块
处理器通信
计算机设备
可读存储介质
存储器
指令
系统为您推荐了相关专利信息
美缝
缺陷监测方法
墙体基层
消息传递机制
纹理特征
对齐方法
索引
非暂态计算机可读存储介质
指令
序列
参数预测方法
补全策略
深度学习神经网络
分解算法
时间序列模型