一种基于知识图谱的领域大模型有害提示词生成方法

正文

推荐专利

申请号：CN202510869845

申请日期：2025-06-26

公开号：CN120974494A

公开日期：2025-11-18

类型：发明专利

摘要

本发明公开了一种基于知识图谱的领域大模型有害提示词生成方法，包括：基于构建的风险知识图谱对通用有害提示词数据集进行筛选得到种子有害提示词库；对领域语料库进行处理得到嵌入式上下文；基于种子有害提示词、风险实体、嵌入式上下文和示例，通过合成模型生成候选有害提示词，并通过毒性指标进行清洗增强得到高风险有害提示词加入种子有害提示词库；基于种子有害提示词与风险实体的语义相关度、以及种子有害提示词的毒性评分筛选出下一轮的提示词输入，构建迭代更新的领域有害提示词数据集。本发明具备高自动化、多维评估、可控生成等特性，可实现多轮人机协同提示词构造，显著提升大语言模型在特定应用领域的红队演练效率与安全测试质量。

技术关键词

生成方法种子语义相关度图谱实体高风险节点大语言模型概念开放知识库数据人机协同语义标签主题语义向量指标文本样本

系统为您推荐了相关专利信息

一种调度自动化系统业务调用模式异常检测方法与系统

异常检测方法调度自动化系统模式实体静态代码分析

基于知识图谱驱动的智能Agent启发式问答教学系统

知识图谱驱动教学系统知识图谱构建实体学生

基于自然语言的复杂室内场景生成方法及系统

房屋框架结构场景生成方法自然语言房间词嵌入向量

交互式教育资源预览生成系统及方法

兴趣知识点场景手势网络

一种扫频光频梳生成系统及生成方法

傅里叶锁模激光器光电振荡器光放大器光频梳光纤隔离器

一种基于知识图谱的领域大模型有害提示词生成方法

站点导航

APP 下载