摘要
本发明实施例提供一种基于向量数据库的电网领域知识库的构建方法及系统,属于新兴软件和新型信息技术服务领域。所述方法包括:获取待存储的电网数据文件;获取所述电网数据文件中的关键词;采用预设的向量数据库对所述关键词进行处理得到字词向量;按照预设的相似距离确定每个所述字词向量的相似字词向量;对所述电网数据文件字词化处理;对字词化处理后的所述电网数据文件进行顺序读取;将读取到的所述字词向量或相似字词向量进行处理得到映射值;根据所述映射值进行计数;将计数的结果作为所述电网数据文件的第二特征;采用所述第二特征和所述关键词对所述电网数据文件进行聚类操作;对聚类操作的结果进行索引编码得到所述电网领域知识库。
技术关键词
字词
关键词
词语
可读存储介质
编码
计数器
构建系统
生成特征
索引
关系
聚类算法
频率
计算机
处理器
指令
软件
数值
节点
系统为您推荐了相关专利信息
装配式建筑施工
风险预测模型
管理方法
关键词
项目特征
口腔护理设备
口腔健康
口腔模型
动画
生成三维模型
供电臂
协同控制方法
牵引供电系统
开关设备
序列
语义特征
商品详情页面
商品推荐方法
推广资源
样本
智能分类方法
BERT模型
文本
卷积神经网络模型
关键词特征