摘要
本发明涉及人工智能及医疗领域,公开了一种手术机器人的VLA模型生成方法、装置、设备及介质,通过将第一数据子集输入至待训练视觉语言行动模型中训练,得到初始视觉语言行动模型;将第一新手术任务数据输入至初始视觉语言行动模型中,并控制手术机器人根据初始视觉语言行动模型输出执行手术动作;利用预设强化学习算法对初始视觉语言行动模型的动作头参数优化,得到第一视觉语言行动模型;将手术机器人成功完成的任务轨迹数据存储至在线数据集;将第二数据子集和任务轨迹数据输入至第一视觉语言行动模型中训练,得到第二视觉语言行动模型,从而不断对VLA模型强化学习,使得手术机器人能够根据实时反馈调整手术策略,进而提高手术精准度。
技术关键词
手术机器人
模型生成方法
视觉
强化学习算法
轨迹
标签
自然语言
多层感知机
数据存储
在线
模型生成装置
计算机设备
视频帧
迭代算法
模型更新
指令
数据更新
策略
系统为您推荐了相关专利信息
分体式光伏
路径跟随算法
清扫机器人
履带行走机构
拉绳位移传感器
动态有向图
协调控制方法
通讯结构
混合网络
矩阵
磁力画板
磁性笔
轨迹
工业机器人关节
控制工业机器人