一种基于参数敏感性量化的敏感提示词生成方法及系统

正文

推荐专利

申请号：CN202511046967

申请日期：2025-07-29

公开号：CN120911454A

公开日期：2025-11-07

类型：发明专利

摘要

本发明公开了一种基于参数敏感性量化的敏感提示词生成方法及系统，涉及人工智能安全技术领域，旨在解决黑盒大语言模型完整性验证中敏感测试样本生成困难的问题。该方法包括：获取原始大语言模型；构建综合参数敏感度指标，其融合了用以表征参数微小修改的微观敏感度，以及用以表征参数量化、剪枝等大幅修改的宏观敏感度，从而全面量化提示词的敏感性；在连续嵌入空间中，采用梯度优化算法以最大化该综合指标为目标进行迭代优化，并施加语义合理性等约束来保证生成提示词的自然流畅；最后，将优化后的嵌入向量映射回离散词元序列，获得最终的敏感提示词。本发明实现了低成本、自动化的测试样本生成，显著提升了云端模型完整性验证的准确性、效率与隐蔽性。

技术关键词

大语言模型参数指标生成方法模型剪枝序列生成系统模块语义样本算法低成本云端

系统为您推荐了相关专利信息

基于BIM的水电工程实时监测系统及方法、设备和存储介质

水电工程设备三维可视化模型参数计算机可执行指令实时监测方法

一种工件加工控制方法及相关设备

动态速度粒子群优化算法工件加工过程处理器

讲题交互方法及相关装置、学习机和存储介质

语句老师大语言模型交互方法指令

一种基于机器学习的肝病多分类风险预测方法及系统

脂肪性肝病风险预测方法机器学习分类模型多项生化指标梯度提升模型

优化大规模语言模型调用工具的方法、装置、电子设备和计算机可读介质

强化学习算法策略生成工具超参数电子设备

一种基于参数敏感性量化的敏感提示词生成方法及系统

站点导航

APP 下载