摘要
本申请公开了一种基于混合强化学习的腔道手术机器人自主导航决策方法及相关装置。该方法包括:获取医生历史操作数据集训练PPO模型进行模仿学习;术中实时采集环境状态输入模型,输出离散动作与连续PID参数;经动态权重融合层生成控制指令,并支持语音或眼动干预覆盖模型输出;将干预内容按优先级存入回放缓冲区并更新模型。本发明通过分层注意力机制提升复杂感知理解能力,利用风险自适应融合策略增强安全性,借助人类干预与优先级经验回放实现持续进化,从而提高腔道手术机器人在狭窄动态环境下的自主导航精度、安全性与临床友好性。
技术关键词
PID控制参数
手术机器人
风险评估值
生物阻抗数据
分层注意力
传感器获取环境
决策方法
力反馈
输入设备
计算机程序产品
计算机程序代码
生成控制指令
动态
存储单元
可读存储介质
融合策略
记忆
系统为您推荐了相关专利信息
多模态融合方法
多模态情感分析
融合特征
模态特征
交叉注意力机制
火灾风险评估
信息处理模块
遥感图像数据
风险评估值
数据采集模块
自动化搬运装置
智能化搬运系统
监控模块
实时数据
物料搬运
影像特征数据
甲氧基肾上腺素
预警模型
内分泌
肿瘤