文章查重方法、装置、设备、可读存储介质和程序产品

AITNT
正文
推荐专利
文章查重方法、装置、设备、可读存储介质和程序产品
申请号:CN202510901845
申请日期:2025-07-01
公开号:CN120805881A
公开日期:2025-10-17
类型:发明专利
摘要
本发明提供了一种文章查重方法、装置、设备、可读存储介质和程序产品,涉及自然语言处理技术领域,方法包括:在确定存在目标词汇的情况下,根据目标词汇,确定待查重文本中各个关键词对应的权重;目标词汇为待查重文本中出现频率大于或等于第一阈值且文本检索库中出现频率小于或等于第二阈值的词汇;基于待查重文本中各个关键词和关键词对应的权重,获取待查重文本与各检索文本之间的第一格式相似度、第一语句相似度和第一主题相似度;对第一格式相似度、第一语句相似度和第一主题相似度进行加权求和,得到待查重文本分别与各检索文本之间的第一相似度;根据第一相似度,从检索文本集合中筛选得到查重结果。本发明实施例的查重结果准确性高。
技术关键词
文章查重方法 文本 关键词 主题特征 LDA模型 格式 可读存储介质 语句 语义 自然语言 查重装置 频率 处理器 计算机程序产品 网络设备 节点
系统为您推荐了相关专利信息
1
一种基于条件类别特定提示的医学图像分类方法
医学图像分类方法 注意力模型 图像块 图像编码器 文本编码器
2
一种多模态医学信息融合的胎儿辅助诊断系统
辅助诊断系统 文本特征向量 图像特征向量 多模态 特征融合网络
3
一种基于DeepSeekR1大模型的轻量化优化方法
核心 网络模块 术语 阶段 语义
4
基于短视频视觉内容呈现风格的用户旅游意愿量化方法
短视频 多元线性回归模型 风格 关键帧 视觉
5
基于自适应超模态和多层注意力的蒙古语多模态情感分析方法
模态特征 多层注意力 蒙古语 文本 音频特征
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号