一种共享记忆矩阵的语言模型使用方法

AITNT
正文
推荐专利
一种共享记忆矩阵的语言模型使用方法
申请号:CN202411644040
申请日期:2024-11-18
公开号:CN119537019B
公开日期:2025-11-07
类型:发明专利
摘要
本发明涉及计算机语言处理技术领域,特别是一种共享记忆矩阵的语言模型使用方法。通过一种循环的迭代结构,将Key矩阵、Value矩阵都通过memory得到,同时保证在推理当前token过程中每层的memory都相同,等效于key张量、value张量共享,从而实现了缓存降低的效果,因而算力资源得到了节省。
技术关键词
文本 前馈神经网络 注意力 矩阵 记忆 列表 训练集 分词 解码 计算机 输出端 阶段 定义 资源
系统为您推荐了相关专利信息
1
一种基于大语言模型的异构动物机器人协作导航系统
动物机器人 大语言模型 语义地图 导航系统 专家控制系统
2
音频声音事件检测方法、装置、可读存储介质及设备
音频特征 声音事件检测方法 特征提取网络 事件检测模型 交叉注意力机制
3
一种基于多视角图神经网络的课堂情绪识别方法
情绪识别方法 融合特征 语音特征 视觉特征 注意力
4
一种基于分段非线性优化的柔性接触线磨耗测量方法
断面轮廓 接触线 磨耗 点云 误差模型
5
一种隧道内车辆的行为检测方法、介质及系统
隧道内车辆 隧道监控 运动特征 训练深度神经网络 车辆运动状态
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号