一种多源海量教育数据统一集成方法

正文

推荐专利

一种多源海量教育数据统一集成方法

申请号：CN202410764855

申请日期：2024-06-14

公开号：CN118643149A

公开日期：2024-09-13

类型：发明专利

摘要

本发明公开了一种多源海量教育数据统一集成方法，包括如下步骤：步骤1、获取学习文档、服务说明文档和事项说明文档，并进行文档加载和分块；步骤2、分别将学习文档、服务说明文档和事项说明文档作为输入，获取文档中单词级别词向量；步骤3、通过注意力机制计算单词级别词向量与上下文词向量的相似性，并根据单词级别词向量以及相似性得到句子级别词向量；步骤4、通过注意力机制计算句子级别词向量与句子级别上下文词向量的相似性，并根据句子级别词向量以及相似性得到文档级别词向量；步骤5、根据文档级别词向量执行文本任务。该方法可以更准确地对文本进行分类，大幅度提升检索的正确性，以提升生成答案的正确率。

技术关键词

集成方法 word2vec模型词嵌入模型文本注意力机制初始聚类中心数据句法分析方法中文分词工具生成答案表达式序列分块代表正确率样本矩阵汉字

系统为您推荐了相关专利信息

一种PDF中表格的提取解析方法

线段解析方法表格判断算法对象

一种基于深度学习的MRI医学图像分割方法及系统

医学图像分割方法深度学习模型对比度通道注意力机制 SVM分类器

一种对话练习方法、装置、存储介质及设备

大语言模型指令场景可读存储介质终端设备

基于动态注意力机制的机器异常声音检测方法及系统

注意力机制时域特征特征提取网络动态输出特征

基于假阴性样本软距离约束的图文跨模态检索方法及系统

样本三元组后验方法语义解码器

一种多源海量教育数据统一集成方法

站点导航

APP 下载