摘要
本发明公开了一种基于词向量的大语言模型输入扰动方法、介质及系统,其中方法包括:获取待处理文本数据,并进行预处理,以得到敏感词集合;基于词向量模型对待处理文本数据进行词向量表示,以得到待处理文本数据对应的基准词向量矩阵,并将基准词向量矩阵输入到大语言模型中,以得到相应的基准输出;基于敏感词集合对待处理文本数据进行微调,以生成微调词向量矩阵,并将微调词向量矩阵输入到大语言模型中,以得到相应的微调输出;比对基准输出和微调输出,以确定词向量扰动范围;根据词向量扰动范围对待处理文本数据进行扰动,以得到最终大语言模型输入;从而实现对用户的隐私进行有效保护,同时,降低隐私保护对于大语言模型输出结果的影响。
技术关键词
文本
扰动方法
大语言模型
条件随机场模型
基准
词向量模型
数据
矩阵
模块
分词
可读存储介质
实体
标签
程序
计算机
处理器
参数
系统为您推荐了相关专利信息
语义特征
预测特征
语义分割方法
视角
文本编码器
三维点云识别方法
文本编码器
图像编码器
多视角
轻量级神经网络