摘要
本发明公开了一种基于大数据的关键词生成方法及系统,涉及关键词生成技术领域,一种基于大数据的关键词生成系统,包括有:文本处理模块、层次主题模块、语义获取模块、验证模块、关键词生成模块和联合损失模块。本发明结合了大数据处理、层次主题模型以及深度学习技术,能够有效提取和生成关键词,通过对文档主题的层次结构进行建模,生成覆盖多层次主题的关键词,提升关键词的准确性和广度;利用预训练模型和主题分布的结合,确保生成的关键词不仅能够反映文档的全局语义,还能够捕捉上下文的细微差别,通过引入变分条件编码器(双向门控循环编码器),系统具备生成未在文档中直接出现的缺席关键词的能力,扩大了关键词生成的范围和灵活性。
技术关键词
层次主题模型
生成关键词
生成方法
大数据
关键词生成系统
语义
文本规范化
变量
编码器
序列
节点
初始化解码器
联合主题
模块
标记
深度学习技术
解码函数