摘要
本发明属于语言处理系统技术领域,公开了一种自进化语义分类与动态知识库构建系统,包括:信息输入模块,将原始文本数据预处理为标准化信息单元一级语义分类模块,基于预训练语言模型对信息单元进行主类识别;二级语义细分类模块,采用生成式语言模型根据上下文生成子类建议并与主类对齐;分类融合模块,对主类和子类结果进行融合,通过语义相似度、语用一致性和置信度计算确定最终主‑子类组合并输出结构化分类结果。本方案实现对信息语义的层级分类、自动生成标准化分类结果、持续反馈学习、自动识别新语义类型以及构建结构化分类知识库,为知识图谱、问答系统、智能推荐等提供标准语义支撑,具有良好的扩展性和实用价值。
技术关键词
构建系统
语义
预训练语言模型
子模块
可视化界面
输入模块
问答系统
动态更新
格式化
决策
文本
数据
意图
图谱
层级
聚类
命令
系统为您推荐了相关专利信息
上下文特征
文本
多头注意力机制
数据获取模块
节点特征
恶意软件数据
Android恶意软件
三元组
恶意软件检测
文本