摘要
本公开实施例提供了一种数据处理方法、装置、介质、程序产品和机器人系统,涉及机器人技术领域。其中,该数据处理方法包括:获取机器人的音频接收器采集的第一音频输入数据;在确定第一音频输入数据中存在生物语音信息的情况下,对该第一音频输入数据进行处理生成用于表征生物语音信息的第一文本编码数据,并从目标缓存中提取预先生成的原始图像编码数据作为目标图像编码数据,该原始图像编码数据为基于机器人的图像传感器采集的原始图像数据进行编码后生成并存储在目标缓存中的数据;根据第一文本编码数据和目标图像编码数据,生成用于回复生物语音信息的第一音频输出数据。这样,可以降低多模态数据处理延迟,减少机器人多模态语音交互的延迟。
技术关键词
图像编码数据
原始图像数据
数据处理方法
音频接收器
图像传感器
机器人系统
数据处理装置
服务器
生物
多模态语音
文本
进程
视频流
计算机程序产品
机器人技术
系统为您推荐了相关专利信息
儿童书包
融合特征
定位方法
实时位置
卡尔曼滤波算法
质谱数据处理方法
分类器模型
一维卷积神经网络
生成技术
人工智能数据处理技术
人脸识别模型
业务数据处理方法
身份
人脸模板
图像
巡查方法
体育场馆
原始图像数据
热力图
三维地形模型
卷积模块
数据处理模型
注意力
上采样
数据处理方法