摘要
本公开提供了一种数据处理方法、装置、设备和介质,涉及人工智能技术领域,尤其涉及自然语言处理、深度学习、大模型等技术领域。该方法包括:获取用户查询请求和文档分片向量库,其中,文档分片向量库是利用构建操作而得到的,构建操作包括:将文档进行切片,得到多个文档分片;对多个文档分片进行向量化,得到多个分片向量;以及将多个分片向量存入文档分片向量库;基于用户查询请求在文档分片向量库中进行检索,得到多个分片向量中的至少一个目标向量;以及基于与至少一个目标向量对应的至少一个目标分片,生成与用户查询请求对应的回复信息。
技术关键词
分片
文本
多模态
标识符
样本
数据处理方法
词嵌入模型
光学字符识别
表格
标签
跨模态
数据处理装置
人工智能技术
计算机程序产品
切片
电子设备
处理器通信
图表
系统为您推荐了相关专利信息
精细提取方法
多尺度膨胀卷积
裸露地表
稀土矿
模块
雷达点云数据
定位方法
匈牙利算法
矩阵
特征轮廓
符号网络模型
深度神经网络
样本
生成符号
修复方法
多模态脑机接口
功能近红外光谱
监护方法
脑电图技术
信号处理