一种大数据文本检索挖掘系统及方法

AITNT
正文
推荐专利
一种大数据文本检索挖掘系统及方法
申请号:CN202510913261
申请日期:2025-07-03
公开号:CN120723917A
公开日期:2025-09-30
类型:发明专利
摘要
本发明涉及大数据挖掘技术领域,具体为一种大数据文本检索挖掘系统及方法,包括获取用户输入的原始文本数据集;基于图神经网络对所述结构化特征矩阵进行关联挖掘,以得到知识关联图谱;接收待检索文本;将所述待检索文本输入至预训练的多模态编码器,以得到复合查询向量;基于所述知识关联图谱对所述候选文本进行关联扩展,以得到扩展文本集合;对所述扩展文本集合进行重要性排序,以得到最终检索结果集。本发明通过跨模态特征映射和多模态数据融合,可以对不同类型的数据进行综合分析;这种特性不仅有助于拓宽检索范围,还能提高检索结果的准确性,尤其是在处理文本以外的其他模态数据时,能充分挖掘数据间的潜在关联。
技术关键词
文本 挖掘系统 图谱 层次聚类算法 检索策略 矩阵 狄利克雷分配模型 显式语义特征 局部敏感哈希算法 特征提取器 稀疏特征 大数据挖掘技术 主成分分析降维 跨模态 扩展单元 主题 网络
系统为您推荐了相关专利信息
1
语音生成模型的训练方法、语音生成方法及相关装置
音频特征 语音生成模型 语音生成方法 参数 文本
2
基于人工智能的多模态智能日历管理系统及方法
智能日历 管理系统 自然语言 预训练语言模型 管理方法
3
一种用于粤语的大模型泛化方法、装置、终端及存储介质
文本 泛化方法 多语言 标签 机器翻译
4
音频处理方法、装置、车辆及存储介质
音频 实体识别模型 文本 语义特征 车辆
5
一种数字人语音交互优化方法及系统
实时语音 交互优化方法 语音识别模型 音频输出模块 文本
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号