基于混合注意力机制的高效安全自然语言处理方法及系统

正文

推荐专利

申请号：CN202510217331

申请日期：2025-02-26

公开号：CN120179771A

公开日期：2025-06-20

类型：发明专利

摘要

本发明涉及自然语言处理技术领域，特别涉及一种基于混合注意力机制的高效安全自然语言处理方法及系统，针对Transformer预训练模型和任务数据集，提出了一种基于Softmax Attention和Scaling Attention的混合注意力机制，设计了post‑replaced和pre‑replaced两种选择替换策略；post‑replaced策略是当拥有某数据集在Scaling Attention上的Transformer预训练模型时，通过性能差异率来计算替换率，确定搜索空间，再根据NAS算法快速搜索关键注意力头，将关键注意力头恢复为Softmax Attention；pre‑replaced策略是当仅有某数据集在Softmax Attention上的Transformer预训练模型，按照由大至小设置替换率；而后通过设计在Softmax注意力机制中进行查找保留关键注意力头的快速NAS搜索算法。本发明通过混合注意力机制和注意力机制替换策略实现Transformer模型在安全执行自然语言分析任务时的速度和模型性能的更优平衡。

技术关键词

注意力机制 NAS算法搜索算法策略自然语言分析知识蒸馏方法计算机装置数据处理器可读存储介质存储器教师学生速度模块协议

系统为您推荐了相关专利信息

中医古籍异体字字典构建及文本对齐方法、系统和介质

卷积神经网络模型文本对齐方法编辑距离算法字符

一种基于追溯码的药品管理方法、设备及介质

药品管理方法医疗信息处理技术合规性风险预警模块

控制方法、装置及机器人

对象策略机器人场景多模态

涉密检测的方法、装置、电子设备及存储介质

神经网络模型数据风险探针电子设备

基于渐进式注意力增强的光学遥感图像显著目标检测方法

光学遥感图像异构融合架构多分支结构层级解码单元

基于混合注意力机制的高效安全自然语言处理方法及系统

站点导航

APP 下载