摘要
本发明公开一种基于相对胜负反馈的双边匹配市场在线学习方法,步骤包括:初始化请求方的偏好序列位置、偏好概率估计及置信半径;请求方基于未被明确拒绝的位置发起申请;提供方随机选择接受者,输出相对胜负反馈;请求方据此更新偏好概率估计和置信半径,构建偏好学习机制;基于更新后的数据及偏好概率差值下限,判断提供方最偏好请求方是否明确,明确则匹配,否则更新位置重复流程,直至所有请求方匹配。本发明依赖相对胜负反馈,通过在线Gale‑Shapley算法实现请求方高效偏好学习与稳定匹配,支持多请求方并行发起申请,引入相对偏好最小差距界定学习效率,适用于反馈有限场景。
技术关键词
在线学习方法
序列
玩家
算法
机制
表达式
关系
逻辑
场景
数据
系统为您推荐了相关专利信息
大语言模型
层次化系统
调优方法
集成算法
结构化数据格式
内容推荐方法
社交网络分析
LSTM模型
长短期记忆网络
强化学习算法
控制系统
等待时间差异
交通信号自适应控制方法
交通流
动态
负载分配方法
柴油发电机
分类边界
动态规划算法
长短期记忆网络