基于内容的新闻去重方法及装置、非易失性存储介质

AITNT
正文
推荐专利
基于内容的新闻去重方法及装置、非易失性存储介质
申请号:CN202511056117
申请日期:2025-07-29
公开号:CN120951982A
公开日期:2025-11-14
类型:发明专利
摘要
本申请公开了一种基于内容的新闻去重方法及装置、非易失性存储介质。其中,该方法包括:获取待处理新闻集合,将文本结构相似度大于或者等于预设相似度的待处理新闻删除,得到剩余待处理新闻;确定每条剩余待处理新闻的内容要素和类目体系,并将内容要素和类目体系完全相同的多条剩余待处理新闻归类为一个待去重集合;对于待去重集合中的每条目标剩余待处理新闻,采用第一提示词触发文本分析模型输出与目标剩余待处理新闻相关的多个提问问题,得到问题列表,并采用第二提示词触发文本分析模型输出目标剩余待处理新闻的摘要信息;根据问题列表的第一语义相似度和摘要信息的第二语义相似度在待去重集合中确定待删除新闻。
技术关键词
文本分析模型 非易失性存储介质 语义 摘要 列表 去重方法 层级 指纹 计算机程序产品 信息编码 处理器 字符 模块 存储器 电子设备 词语 频率 指令
系统为您推荐了相关专利信息
1
基于人工智能的维修厂推荐方法、装置、设备及介质
推荐方法 服务质量数据 车辆 报告 参数
2
一种基于Mamba网络双向指导模型的显著性目标检测方法
表达式 Softmax函数 融合特征 分支 两阶段
3
一种流动行为识别方法、装置、设备及存储介质
序列 筛选算法 识别方法 数据 计算方法
4
一种应用程序打包方法、装置及电子设备
应用程序打包方法 图片 动态 接口 资源
5
一种基于语义向量的权重搜索系统及其使用方法
语义向量 搜索系统 字段 语句 模块
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号