基于注意力头的大语言模型功能分区探测方法及系统

AITNT
正文
推荐专利
基于注意力头的大语言模型功能分区探测方法及系统
申请号:CN202510424728
申请日期:2025-04-07
公开号:CN120317284A
公开日期:2025-07-15
类型:发明专利
摘要
本发明实施例提供一种基于注意力头的大语言模型功能分区探测方法及系统。该方法包括:利用包括对预设特定任务的输入语句、预期输出语句的训练数据仅对大语言模型中注意力头权重进行训练,在训练结束后,使用二值化函数对注意力头权重进行转换,得到对应大语言模型内各注意力头的注意力头掩码;通过调控注意力头掩码对大语言模型内各注意力头的输出进行掩码,以实现选择性的使用大语言模型内的注意力头,探测出未被掩码而被选择到的注意力头组成相互依赖的功能分区通路。本发明实施例通过选择注意力头使大模型选择性地执行任务,来解释被选择的注意力头所涉及的功能作用,还对大语言模型多功能性的机理做出了解释,使模型表现出功能性。
技术关键词
注意力 大语言模型 分区探测方法 语句 计算机程序产品 数据 探测系统 处理器通信 指令 解码 存储器 电子设备 模块 参数
系统为您推荐了相关专利信息
1
一种基于深度学习的脊髓损伤检测方法和装置
损伤检测方法 鸟巢 布谷鸟优化 训练卷积神经网络 影像
2
一种基于无人机低空摄影的道路裂缝快速识别和计算方法
快速识别方法 裂缝 运动恢复结构 三角网格模型 三维重建方法
3
面向多模态用户行为分析的动态时序音乐推荐方法及设备
音乐推荐方法 三元组 多模态 兴趣 动态
4
车辆密集场景中的图像-文本跨模态车辆检索模型训练方法
语义特征 跨模态 sigmoid函数 模型训练方法 局部图像特征
5
腋窝淋巴结预测模型的训练方法、腋窝淋巴结的预测方法
腋窝 超声造影 融合特征 特征提取单元 空间特征提取
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号