一种基于知识图谱的领域大模型有害提示词生成方法

AITNT
正文
推荐专利
一种基于知识图谱的领域大模型有害提示词生成方法
申请号:CN202510869845
申请日期:2025-06-26
公开号:CN120974494A
公开日期:2025-11-18
类型:发明专利
摘要
本发明公开了一种基于知识图谱的领域大模型有害提示词生成方法,包括:基于构建的风险知识图谱对通用有害提示词数据集进行筛选得到种子有害提示词库;对领域语料库进行处理得到嵌入式上下文;基于种子有害提示词、风险实体、嵌入式上下文和示例,通过合成模型生成候选有害提示词,并通过毒性指标进行清洗增强得到高风险有害提示词加入种子有害提示词库;基于种子有害提示词与风险实体的语义相关度、以及种子有害提示词的毒性评分筛选出下一轮的提示词输入,构建迭代更新的领域有害提示词数据集。本发明具备高自动化、多维评估、可控生成等特性,可实现多轮人机协同提示词构造,显著提升大语言模型在特定应用领域的红队演练效率与安全测试质量。
技术关键词
生成方法 种子 语义相关度 图谱 实体 高风险 节点 大语言模型 概念 开放知识库 数据 人机协同 语义标签 主题 语义向量 指标 文本 样本
系统为您推荐了相关专利信息
1
一种调度自动化系统业务调用模式异常检测方法与系统
异常检测方法 调度自动化系统 模式 实体 静态代码分析
2
基于知识图谱驱动的智能Agent启发式问答教学系统
知识图谱驱动 教学系统 知识图谱构建 实体 学生
3
基于自然语言的复杂室内场景生成方法及系统
房屋框架结构 场景生成方法 自然语言 房间 词嵌入向量
4
交互式教育资源预览生成系统及方法
兴趣 知识点 场景 手势 网络
5
一种扫频光频梳生成系统及生成方法
傅里叶锁模激光器 光电振荡器 光放大器 光频梳 光纤隔离器
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号