摘要
本发明涉及一种基于多算法融合与大模型的自演进知识库构建方法,其中,所述的方法包括以下步骤:(1)对输入的已知业务文本数据进行数据清洗和整理,获取干净的文本数据;(2)利用基于LDA_Word2vec的核心主题分类单元和基于SVM的子主题分类单元对清洗后的文本数据进行主题分类,获取核心主题、子主题及其对应的关键词和词向量;(3)基于大模型对数据库数据进行未知主题分类和要素提取,并将其与步骤(2)的主题分类结果进行融合;(4)对初始知识库和增量式动态知识进行相关性关联分析、数据整合和版本管理,更新主动态知识库,最终形成动态知识库。采用了本发明的该基于多算法融合与大模型的自演进知识库构建方法,能够有效提高分类精度。
技术关键词
知识库构建方法
多算法融合
计算机可执行指令
停用词表
文本
词语
数据
Softmax函数
核心
LDA主题模型
关键词
动态
知识图谱推理
关系抽取模型
处理器
矩阵
词向量训练
BERT模型
命名实体识别
系统为您推荐了相关专利信息
文本生成方法
主题关键词
实体
关系
文本生成装置
智能对话生成方法
对话生成模型
多轮对话
画像特征
混合编码器