摘要
本发明公开了一种基于大模型的知识点提取方法及系统,其包括:获取待提取知识文本,并通过大模型预处理得到文本重要词;对预处理得到的文本重要词向量化处理得到文本词向量,并通过集合得到文本向量数据集;对文本向量数据集聚类分析,将文本向量数据集划分为不同的簇;对文本词向量分析,从每个簇中选取出代表该簇主题的关键词作为该簇的知识主题;分析各簇中每个文本重要词与知识主题的关联程度,并将其达到预设条件的文本重要词提取出作为每个簇的知识点;对每个簇中提取出的知识点不断集合和更新得到最终知识点集合。本发明可以从文本数据中提取出有用的知识信息,并且通过不断的更新和完善知识点集合,帮助更好地理解文本数据的内容和主题。
技术关键词
文本
知识点
主题
关键词
数据
词向量分析
词嵌入技术
分词
代表
标签
模块
关系
算法
系统为您推荐了相关专利信息
故障诊断方法
故障诊断模型
高斯径向基函数
核极限学习机模型
正则化参数
盖板组件
虹膜扫描仪
存储盘
生物识别
检测传感器
历史运行数据
人工智能模型
指标
智能生成方法
电网运行方式数据