一种基于数据中台的教学领域数据采集方法及相关装置

AITNT
正文
推荐专利
一种基于数据中台的教学领域数据采集方法及相关装置
申请号:CN202510632108
申请日期:2025-05-16
公开号:CN120196726A
公开日期:2025-06-24
类型:发明专利
摘要
本发明公开了一种基于数据中台的教学领域数据采集方法及相关装置,其方法包括:数据中台接收用户基于检索终端上传的数据检索需求文本,并提取到数据检索需求文本中的检索需求语义信息;对检索需求语义信息进行语义分词处理,并基于分词处理结果生成检索需求嵌入词向量;将检索需求嵌入词向量与索引数据库中存储的嵌入词向量进行向量相似度计算处理,获得向量相似度计算结果;基于向量相似度计算结果选择对应的检索嵌入词向量;基于检索嵌入词向量构建提示词,并基于提示词调用大语言模型在数据中台中返回需要采集的教学领域数据信息。在本发明实施例中,实现在数据中台中可以精确的检索到所需要的教学领域数据,从而提升数据采集的效率。
技术关键词
数据采集方法 语义 大语言模型 教学 词向量构建 分词 文本 索引 终端建立通信 训练语言模型 数据采集装置 存储计算机程序 数据采集模块 标记 处理器 可读存储介质 存储器
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号