知识文档去重方法和知识文档去重装置

AITNT
正文
推荐专利
知识文档去重方法和知识文档去重装置
申请号:CN202510567973
申请日期:2025-04-30
公开号:CN120687446A
公开日期:2025-09-23
类型:发明专利
摘要
本申请涉及一种知识文档去重方法和知识文档去重装置,其中,该知识文档去重方法,包括:在接收到预设的知识文档调用请求的情况下,获取数据预处理后的文本段落集;根据子句语义相似度、交集词比例以及相似词比例,在文本段落集中属于不同知识文档的各子句之间进行子句相似度计算,得到子句综合相似度;根据子句综合相似度,结合段落语义相似度,确定文本段落集中属于不同知识文档的各文本段落单元之间的段落综合相似度;根据段落综合相似度,确定不同知识文档的去重结果。其能够兼容更为细粒度的识别逻辑、提升对关键词的识别效果、最终提高文本去重的准确度。
技术关键词
文本段落 去重方法 去重装置 大语言模型 问答模型 关键词 语义向量 逻辑回归模型 模块 聚类 样本 关系 在线 离线 数据
系统为您推荐了相关专利信息
1
矿井通风事件捕捉与动作推理智能问答方法
智能问答方法 三元组 实体 语义标签 图谱
2
一种基于大语言模型的企微营销辅助方法与系统
营销辅助方法 大语言模型 聊天场景 识别关键信息 订单
3
一种基于大语言模型的患者健康教育和咨询系统
咨询系统 大语言模型 患者健康 数据收集模块 输出模块
4
大模型与动态知识库协同分类决策方法、系统及设备
动态知识图谱 大语言模型 数据分类 决策方法 确定性规则
5
一种多模态海洋温盐遥感预测方法及装置
海洋温盐 海洋遥感数据 多模态特征融合 遥感预测方法 大语言模型
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号