摘要
本发明涉及知识增强技术领域,公开了一种基于embedding模型的知识增强方法及装置,方法包括:获取用户上传的目标问题和原始文档;切分原始文档得到文本块,生成针对文本块的问答对;采用初始embedding模型将原始文档转换为原始向量,基于原始向量进行聚类得到多个聚类类别和文档权重;基于聚类类别训练模型得到目标embedding模型,基于此将目标问题和问答对中的生成问题转换为目标问题向量和生成问题向量;基于文档权重,计算目标问题向量与生成问题向量之间的相似度距离,基于此从原始文档中召回目标文档。本发明有效提升检索召回的准确性与公平性,解决类别不平衡问题,生成准确、高质量的答案,有效改善用户体验。
技术关键词
聚类
文本
语义主题
更新模型参数
可读存储介质
大语言模型
注意力
模块
存储器
处理器
指令
计算机设备
答案
格式
标签
系统为您推荐了相关专利信息
神经元网络模型
服务能力评估方法
客服
指标
主成分分析法
电网运行优化方法
多约束条件
多重约束条件
可再生能源
算法
word2vec模型
XGBoost模型
网格
自然语言
梯度提升决策树
电力杆塔
卫星遥感影像
特征提取网络
角度计算方法
更新模型参数