摘要
本发明公开了一种多源海量教育数据统一集成方法,包括如下步骤:步骤1、获取学习文档、服务说明文档和事项说明文档,并进行文档加载和分块;步骤2、分别将学习文档、服务说明文档和事项说明文档作为输入,获取文档中单词级别词向量;步骤3、通过注意力机制计算单词级别词向量与上下文词向量的相似性,并根据单词级别词向量以及相似性得到句子级别词向量;步骤4、通过注意力机制计算句子级别词向量与句子级别上下文词向量的相似性,并根据句子级别词向量以及相似性得到文档级别词向量;步骤5、根据文档级别词向量执行文本任务。该方法可以更准确地对文本进行分类,大幅度提升检索的正确性,以提升生成答案的正确率。
技术关键词
集成方法
word2vec模型
词嵌入模型
文本
注意力机制
初始聚类中心
数据
句法分析方法
中文分词工具
生成答案
表达式
序列
分块
代表
正确率
样本
矩阵
汉字
系统为您推荐了相关专利信息
医学图像分割方法
深度学习模型
对比度
通道注意力机制
SVM分类器
注意力机制
时域特征
特征提取网络
动态
输出特征