一种多源海量教育数据统一集成方法

AITNT
正文
推荐专利
一种多源海量教育数据统一集成方法
申请号:CN202410764855
申请日期:2024-06-14
公开号:CN118643149A
公开日期:2024-09-13
类型:发明专利
摘要
本发明公开了一种多源海量教育数据统一集成方法,包括如下步骤:步骤1、获取学习文档、服务说明文档和事项说明文档,并进行文档加载和分块;步骤2、分别将学习文档、服务说明文档和事项说明文档作为输入,获取文档中单词级别词向量;步骤3、通过注意力机制计算单词级别词向量与上下文词向量的相似性,并根据单词级别词向量以及相似性得到句子级别词向量;步骤4、通过注意力机制计算句子级别词向量与句子级别上下文词向量的相似性,并根据句子级别词向量以及相似性得到文档级别词向量;步骤5、根据文档级别词向量执行文本任务。该方法可以更准确地对文本进行分类,大幅度提升检索的正确性,以提升生成答案的正确率。
技术关键词
集成方法 word2vec模型 词嵌入模型 文本 注意力机制 初始聚类中心 数据 句法分析方法 中文分词工具 生成答案 表达式 序列 分块 代表 正确率 样本 矩阵 汉字
系统为您推荐了相关专利信息
1
一种PDF中表格的提取解析方法
线段 解析方法 表格 判断算法 对象
2
一种基于深度学习的MRI医学图像分割方法及系统
医学图像分割方法 深度学习模型 对比度 通道注意力机制 SVM分类器
3
一种对话练习方法、装置、存储介质及设备
大语言模型 指令 场景 可读存储介质 终端设备
4
基于动态注意力机制的机器异常声音检测方法及系统
注意力机制 时域特征 特征提取网络 动态 输出特征
5
基于假阴性样本软距离约束的图文跨模态检索方法及系统
样本 三元组 后验方法 语义 解码器
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号