一种基于多模态交互的人宠对讲方法及系统

正文

推荐专利

一种基于多模态交互的人宠对讲方法及系统

申请号：CN202510786448

申请日期：2025-06-12

公开号：CN120636418A

公开日期：2025-09-12

类型：发明专利

摘要

本申请公开了一种基于多模态交互的人宠对讲方法及系统，涉及人工智能领域。该方法包括：接收用户设备端针对目标宠物发送的对话信号，根据本地语言库确定对话信号对应的动物语音信息，本地语言库包括每种对话信号与动物语音信息之间的对应关系；获取目标宠物针对对话信号的实时反映数据，实时反映数据包括目标宠物的声音数据、动作图像数据和环境数据；将实时反映数据输入至多模态翻译模型，得到目标宠物针对对话信号做出回应的翻译结果，并将翻译结果发送至用户设备。本申请实施例中翻译结果中整合了声音数据、动作数据和环境数据，实现了数据的高效融合，提升了翻译可靠性的同时解决了低置信度误判率高的问题，提升了人宠交互的准确性与适应性。

技术关键词

注意力多模态交互设备端翻译模型图像数据跨模态噪声抑制动态权重分配解码器信号编码器背景噪声信息传输模块语音报警指示灯内存模块动物主控系统

系统为您推荐了相关专利信息

一种基于CycleGan的多模态医学影像弹性配准系统

配准系统多模态医学影像医学影像数据累积分布函数掩模

知识蒸馏方法及电子设备

注意力矩阵知识蒸馏方法学生网络

一种基于EMD框架的锂电池寿命预测方法

集合经验模态分解交互注意力退化模型通道注意力机制锂电池寿命预测

一种基于向量的平台图片搜索和展示方法、设备及介质

商品特征展示方法深度学习模型计算机可执行指令电商平台技术

一种基于非对称的轻量级医学图像分割网络（ABUNet）及其实现方法

医学图像分割网络解码器编码器阶段医学图像分割系统

一种基于多模态交互的人宠对讲方法及系统

站点导航

APP 下载