摘要
本发明提供一种基于关键词溯源的大语言模型系统,涉及数据处理技术领域,所述系统包括:数据采集模块;文本预处理模块;关键词筛选模块;语义扩展模块,用于对初步关键词数据集中的关键词进行语义扩展处理,生成扩展关键词数据集;关键词传播检测模块,用于根据扩展关键词数据集中的关键词的起源标识、出现频次、时间戳和用户行为信息,生成关键词传播路径数据集;热度计算模块,用于根据关键词传播路径数据集,生成热度评分;语义漂移检测模块,用于根据关键词传播路径数据集,生成语义漂移标识;信息溯源报告生成模块,用于根据传播路径数据集、关键词热度评分和语义漂移标识,生成溯源报告;本发明具有良好的关键词溯源效果。
技术关键词
语义
生成关键词
信息平台
文本
词语
时间段
同义词库
节点
扩展模块
标记
标识
频率随时间变化
轨迹
数据采集模块
分词
生成同义词
系统为您推荐了相关专利信息
报告生成系统
机器学习方法预测
自然语言生成技术
处理单元
数据整合技术
语音生成方法
语音生成模型
多轮对话
语义特征
文本
一体化管理方法
管理策略
数据存储策略
资产
关键帧
动态场景感知
权限分配方法
轨迹
智慧管理平台
语义