一种基于LLM2Vec算法的文本查重方法及系统

AITNT
正文
推荐专利
一种基于LLM2Vec算法的文本查重方法及系统
申请号:CN202410954853
申请日期:2024-07-17
公开号:CN118885602A
公开日期:2024-11-01
类型:发明专利
摘要
本发明公开了一种基于LLM2Vec算法的文本查重方法及系统,用于文本查重技术领域,该基于LLM2Vec算法的文本查重方法及系统包括以下步骤:使用LLM2Vec算法将文本转换为特征向量;利用余弦相似度方法计算各特征向量之间的余弦相似度;预设相似度阈值,将计算得到的余弦相似度与相似度阈值比较,并判断本文之间是否相似。本发明通过生成高质量文本向量表示的文本编码器,不仅能够捕捉文本的丰富语义信息,还能够区分不同文本之间的细微差别,这对于各种自然语言处理任务都是非常有价值的。
技术关键词
文本查重方法 文本编码器 向量空间模型 查重系统 算法 注意力 特征提取模块 模型训练模块 解码器 序列 矩阵 自然语言 语义 元素
系统为您推荐了相关专利信息
1
学习者多层级认知水平的动态挖掘方法及系统
动态挖掘方法 层级 多头注意力机制 梯度下降算法 复杂度
2
一种障碍物运动轨迹预测方法及装置
运动轨迹预测方法 地图特征 车辆传感器组件 意图 坐标系
3
智能手表的显示屏幕控制方法、装置、设备及存储介质
显示屏幕控制方法 智能手表 分区 参数 卡尔曼滤波算法
4
一种微纳无人机集群互定位方法、装置
无人机集群 非暂时性计算机可读存储介质 无人机定位装置 无人机定位技术 定位方法
5
一种基于用户画像的职位智能推荐方法及系统
职位智能推荐方法 画像 生成用户 关键词提取算法 编码
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号