一种基于模型的强化学习方法的采集样本优化方法及装置

AITNT
正文
推荐专利
一种基于模型的强化学习方法的采集样本优化方法及装置
申请号:CN202510148893
申请日期:2025-02-11
公开号:CN120180117A
公开日期:2025-06-20
类型:发明专利
摘要
本说明书实施例属于人工智能领域,尤其涉及一种基于模型的强化学习方法的采集样本优化方法及装置,所述方法包括:获取预设的当前状态及对应的多个可选动作指令;将所述预设的当前状态及对应的每一可选动作指令输入至多个动作价值预测模型,得到每一可选动作指令分别对应的多个动作价值;计算每一可选动作指令的动作价值集中趋势及离散程度,并根据所述集中趋势及离散程度确定预设的当前状态对应的每一可选动作指令的得分;根据所述可选动作指令的得分,确定预设的当前状态对应的各可选动作指令的采样概率,所述采样概率用于智能体的样本采样。解决了强化学习方法的训练样本质量不高,导致模型收敛效率低的问题。
技术关键词
指令 强化学习方法 状态转移模型 样本 计算机设备 计算机程序产品 处理器 可读存储介质 优化装置 轨迹 模块 存储器 方程
系统为您推荐了相关专利信息
1
一种用于优化软管外膜耐磨性的处理系统
涂层 三维模型 轮廓提取 三维可视化平台 样本
2
一种鲁棒/非鲁棒特征的互信息估计器及鲁棒性评估方法
图像分类模型 鲁棒性评估方法 样本 特征提取单元 图像数据处理技术
3
车辆影像数据的显示方法、车辆控制方法、装置及设备
数据 显示设备 图像采集设备 车辆控制方法 算法
4
一种基于拍摄跟踪的接触线磨损检测方法及系统
接触线 边缘轮廓 坐标 样条 曲线
5
一种基于人工智能的教育资源个性化推荐方法及系统
教育资源个性化推荐方法 视频 关键词 教育资源个性化推荐系统 知识点
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号