基于词向量的大语言模型输入扰动方法、介质及系统

AITNT
正文
推荐专利
基于词向量的大语言模型输入扰动方法、介质及系统
申请号:CN202510686093
申请日期:2025-05-27
公开号:CN120197715B
公开日期:2025-07-25
类型:发明专利
摘要
本发明公开了一种基于词向量的大语言模型输入扰动方法、介质及系统,其中方法包括:获取待处理文本数据,并进行预处理,以得到敏感词集合;基于词向量模型对待处理文本数据进行词向量表示,以得到待处理文本数据对应的基准词向量矩阵,并将基准词向量矩阵输入到大语言模型中,以得到相应的基准输出;基于敏感词集合对待处理文本数据进行微调,以生成微调词向量矩阵,并将微调词向量矩阵输入到大语言模型中,以得到相应的微调输出;比对基准输出和微调输出,以确定词向量扰动范围;根据词向量扰动范围对待处理文本数据进行扰动,以得到最终大语言模型输入;从而实现对用户的隐私进行有效保护,同时,降低隐私保护对于大语言模型输出结果的影响。
技术关键词
文本 扰动方法 大语言模型 条件随机场模型 基准 词向量模型 数据 矩阵 模块 分词 可读存储介质 实体 标签 程序 计算机 处理器 参数
系统为您推荐了相关专利信息
1
一种基于三维高斯场景的开放词汇语义分割方法及装置
语义特征 预测特征 语义分割方法 视角 文本编码器
2
一种基于视角特定提示词的三维点云识别方法及相关设备
三维点云识别方法 文本编码器 图像编码器 多视角 轻量级神经网络
3
一种基于神经编解码器的老挝语细粒度韵律建模方法
编解码器 编码器模块 语音 韵律特征 建模方法
4
模型生成方法、语音合成方法、相关装置、介质及产品
模型生成方法 语音特征 样本 文本 数据
5
一种事件脉络生成方法、系统、存储介质及计算机设备
事件脉络生成方法 大语言模型 关键词 话题 模版
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号