摘要
本发明属于大模型保护数据的技术领域,更具体地,涉及基于马尔可夫决策过程的大语言模型多阶段隐私保护方法。所述方法包括系统建模,设计基于MDP的动态隐私保护模型MDP‑PPFC。所述模型包括系统状态和状态转换,在系统中引入纳什均衡的功能来分析模型中的收益函数,用户和系统可以找到保护隐私问题的权衡来最大化准确结果;系统分析,获取MoD数据效用测量和分析隐私损失;最优防御策略中的强化学习,修改SARSA强化学习算法以在提出的模型中获得零和多阶段博弈的独占纳什结果。本发明解决了各种局限性导致先前的研究无法全面揭示隐私保护过程中所面临的风险的问题。
技术关键词
隐私保护方法
策略
多阶段
强化学习算法
决策
消息
动态
定义系统
状态转换概率
代表
度量
数据
可读存储介质
交互机制
采取行动
处理器
通信设备
系统为您推荐了相关专利信息
故障分析方法
资产
故障分析系统
可视化模板
多模态
温度自适应控制方法
PID控制参数
位置更新
温度控制系统
通信机柜系统
业务管理系统
智能分析模块
集成模块
在线
监控模块
应力场
决策支持系统
关联特征数据
表面温度数据
风险