基于词向量的大语言模型输入扰动方法、介质及系统

正文

推荐专利

申请号：CN202510686093

申请日期：2025-05-27

公开号：CN120197715B

公开日期：2025-07-25

类型：发明专利

摘要

本发明公开了一种基于词向量的大语言模型输入扰动方法、介质及系统，其中方法包括：获取待处理文本数据，并进行预处理，以得到敏感词集合；基于词向量模型对待处理文本数据进行词向量表示，以得到待处理文本数据对应的基准词向量矩阵，并将基准词向量矩阵输入到大语言模型中，以得到相应的基准输出；基于敏感词集合对待处理文本数据进行微调，以生成微调词向量矩阵，并将微调词向量矩阵输入到大语言模型中，以得到相应的微调输出；比对基准输出和微调输出，以确定词向量扰动范围；根据词向量扰动范围对待处理文本数据进行扰动，以得到最终大语言模型输入；从而实现对用户的隐私进行有效保护，同时，降低隐私保护对于大语言模型输出结果的影响。

技术关键词

文本扰动方法大语言模型条件随机场模型基准词向量模型数据矩阵模块分词可读存储介质实体标签程序计算机处理器参数

系统为您推荐了相关专利信息

一种基于三维高斯场景的开放词汇语义分割方法及装置

语义特征预测特征语义分割方法视角文本编码器

一种基于视角特定提示词的三维点云识别方法及相关设备

三维点云识别方法文本编码器图像编码器多视角轻量级神经网络

一种基于神经编解码器的老挝语细粒度韵律建模方法

编解码器编码器模块语音韵律特征建模方法

模型生成方法、语音合成方法、相关装置、介质及产品

模型生成方法语音特征样本文本数据

一种事件脉络生成方法、系统、存储介质及计算机设备

事件脉络生成方法大语言模型关键词话题模版

基于词向量的大语言模型输入扰动方法、介质及系统

站点导航

APP 下载