摘要
本发明涉及人工智能、金融及医疗健康技术领域,公开了动作生成方法、装置、计算机设备及存储介质。方法包括获取视觉信息和语言指令,以得到初始数据;对初始数据进行数据处理,以得到处理结果;根据处理结果利用双向注意力机制同步生成多个动作,以得到并行动作;根据并行动作通过双层MLP进行处理,以得到最终动作;输出最终动作,以执行最终动作。该方法特别适用于需要高精度和实时响应的复杂场景,包括金融市场中的自动化交易系统以及医疗领域中的手术机器人操作,其中快速准确的动作生成对于提高效率和安全性至关重要。通过实施本发明的方法可实现有效提升VLA模型适应性和效率,降低了计算成本,提高了计算资源的利用效率。
技术关键词
动作生成方法
双向注意力机制
自动化交易系统
计算机设备
动作生成装置
医疗健康技术
语言编码器
解码器
手术机器人
数据
视觉
处理器
处理单元
指令
存储器
金融
场景
系统为您推荐了相关专利信息
语音识别纠错方法
语音识别错误
汉字
拼音
文本理解
离散余弦变换
分块
图像像素
识别方法
计算机可读指令
需求预测模型
长短期记忆网络
交通流量预测方法
终点
空间特征提取