一种知识数据去重方法、装置、设备及介质

AITNT
正文
推荐专利
一种知识数据去重方法、装置、设备及介质
申请号:CN202510681291
申请日期:2025-05-23
公开号:CN120804315A
公开日期:2025-10-17
类型:发明专利
摘要
本申请属于大数据领域,涉及一种知识数据去重方法,包括:从知识文档库中获取目标知识数据,目标知识数据包括多个知识文档;基于预设的哈希聚类算法,对多个知识文档进行文本聚类,得到多组文档簇;采用预设的语义向量模型,对多组文档簇内各知识文档进行语义去重,得到目标知识数据对应的去重文档。本申请还提供一种装置、设备及介质。本申请可应用于金融保险等业务领域中,可以提高知识数据去重的效率和准确率。
技术关键词
局部敏感哈希 数据去重方法 聚类算法 计算机可读指令 语义特征 语义向量 数据去重装置 汉明距离 可读存储介质 文本 处理器 计算机设备 矩阵 存储器 大数据 模块
系统为您推荐了相关专利信息
1
自适应音频增强方法、装置、SoC芯片及存储介质
音频特征 信号 参数 时序 谐波结构
2
基于互联网财经信息的热点挖掘系统、方法及介质
热点挖掘系统 热点挖掘方法 信息采集模块 互联网 文本聚类算法
3
一种结合人工智能的小儿淋巴瘤超声辅助诊断系统
超声辅助诊断系统 语义特征 特征提取模块 扫描单元 图像采集模块
4
基于模型协作自适配翻译多国语言的方法及装置
文本 上下文语义理解 搜索算法优化 损失函数优化 图片
5
一种多尺度时空特征提取与融合的天气预测方法及系统
天气预测方法 时空融合特征 气象站 多尺度特征融合 节点
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号