面向医疗大语言模型的有害回复防御方法及装置

正文

推荐专利

申请号：CN202511167558

申请日期：2025-08-20

公开号：CN120653770B

公开日期：2025-10-28

类型：发明专利

摘要

本发明公开了一种面向医疗大语言模型的有害回复防御方法及装置，涉及自然语言处理领域，包括：获取用户的输入语句并输入到经训练的改写模型中，输出改写语句；若需要进行检索增强生成，则将改写语句在医学知识库中进行检索，将改写语句与每个医学知识片段拼接并输入到经训练的医疗大语言模型，生成响应语句；结合医学知识片段对每个响应语句进行安全评分计算，得到第一安全评分；判断是否存在第一安全评分大于安全阈值，若是则将第一安全评分最高所对应的响应语句作为回复语句，否则进行筛选，根据筛选结果确定回复语句；将回复语句输入到经训练的判断模型中，将不存在有害内容的回复语句进行输出。本发明解决难以对输入语句有效识别过滤的问题。

技术关键词

大语言模型医学知识库关键词生成回复语句语义医学专用处理器计算机程序产品标记文本自然语言识别模块存储装置可读存储介质电子设备数据

系统为您推荐了相关专利信息

计算机实施的方法，数据处理设备，以及手术显微镜系统

手术显微镜系统数据处理设备对象计算机图像

基于深度学习的电力工程安全监控方法及系统

语义向量安全监控方法参数图像轨迹

一种基于大语言模型工作流程的运维问答系统及方法

大语言模型问答方法文本问答系统语义

一种小行星多阶段地物识别与表面特征解析方法

地物识别识别感兴趣区域解析方法标志物分割方法

一种跨区域API资产管理方法、装置、设备及存储介质

资产管理方法接口特征 DNS解析网络边界聚类

面向医疗大语言模型的有害回复防御方法及装置

站点导航

APP 下载