摘要
本发明涉及深度学习技术领域,公开了一种基于任务模式感知的多头注意力量化方法。该方法包括:针对每种类型的模型任务,获取在采用多头注意力机制处理模型任务的输入数据时,多头注意力机制中每个注意力头的注意力权重矩阵;根据注意力权重矩阵中所有注意力权重的大值分布情况,对模型任务的每个注意力头进行模式识别;其中,注意力权重的大值分布情况用于指示输入数据中所有令牌的注意力分布情况;根据模型任务的每个注意力头的模式识别结果,在采用多头注意力机制处理模型任务的输入数据时进行量化处理,从而提升面向多头注意力机制的任务处理效率和处理效果。
技术关键词
多头注意力机制
数据格式
模式识别
令牌
矩阵
精度
深度学习技术
处理器通信
计算机设备
语义
可读存储介质
模块
存储器
频率
指令
系统为您推荐了相关专利信息
无人机红外图像
拼接方法
稀疏线性系统
时序
全局匹配方法
触觉传感器
表面测量方法
接触点
标定方法
旋转变换矩阵
无模型自适应控制方法
状态观测器
投影算法
状态空间模型
线性化方法