摘要
本发明公开了一种基于LLM2Vec算法的文本查重方法及系统,用于文本查重技术领域,该基于LLM2Vec算法的文本查重方法及系统包括以下步骤:使用LLM2Vec算法将文本转换为特征向量;利用余弦相似度方法计算各特征向量之间的余弦相似度;预设相似度阈值,将计算得到的余弦相似度与相似度阈值比较,并判断本文之间是否相似。本发明通过生成高质量文本向量表示的文本编码器,不仅能够捕捉文本的丰富语义信息,还能够区分不同文本之间的细微差别,这对于各种自然语言处理任务都是非常有价值的。
技术关键词
文本查重方法
文本编码器
向量空间模型
查重系统
算法
注意力
特征提取模块
模型训练模块
解码器
序列
矩阵
自然语言
语义
元素
系统为您推荐了相关专利信息
动态挖掘方法
层级
多头注意力机制
梯度下降算法
复杂度
运动轨迹预测方法
地图特征
车辆传感器组件
意图
坐标系
显示屏幕控制方法
智能手表
分区
参数
卡尔曼滤波算法
无人机集群
非暂时性计算机可读存储介质
无人机定位装置
无人机定位技术
定位方法
职位智能推荐方法
画像
生成用户
关键词提取算法
编码