模型推理方法和装置

AITNT
正文
推荐专利
模型推理方法和装置
申请号:CN202510388382
申请日期:2025-03-28
公开号:CN120235242A
公开日期:2025-07-01
类型:发明专利
摘要
公开了一种模型推理方法和装置。该方法包括:对输入文本进行预处理以将其转换为语义向量序列;通过降维映射和键‑值映射,计算语义向量序列对应的压缩键和压缩值矩阵并将其存入预设缓存空间中;响应于循环结束条件未被满足,循环执行下述步骤:基于针对目标语义向量以及预设缓存空间中存储的压缩键和压缩值矩阵的第一线性变换,计算当前注意力表示;基于当前注意力表示生成新语义向量并更新语义向量序列;通过降维映射和键‑值映射,计算新语义向量对应的压缩键向量和压缩值向量并更新压缩键矩阵和压缩值矩阵。根据本申请的模型推理方法可以在保证模型推理效果和性能的同时显著提升推理效率。
技术关键词
语义向量 矩阵 序列 多头注意力机制 推理方法 文本 计算机可读指令 前馈神经网络 推理装置 计算机程序产品 处理器 分块 可读存储介质 存储器 模块 分词 字符
系统为您推荐了相关专利信息
1
一种靶机大攻角飞行鲁棒H∞控制方法及系统
靶机 鲁棒控制系统 求解线性矩阵 方向舵 误差模型
2
基于半监督聚类算法的自治系统组织机构映射方法及装置
半监督聚类 号码 映射方法 矩阵 组织
3
一种多模态情绪分析系统及方法
多模态情绪 情绪特征 分析系统 代表 文本
4
基于时间核平稳广义学习系统的炼铁过程异常检测方法
异常检测方法 宽度学习系统 参数优化算法 广义 变量
5
一种基于选区激光熔化的打印路径优化方法
选区激光熔化 路径优化方法 平衡二叉树 蚁群算法 三维模型
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号