一种基于AI大模型的机器人可视化交互控制方法

正文

推荐专利

申请号：CN202411473048

申请日期：2024-10-22

公开号：CN119479640A

公开日期：2025-02-18

类型：发明专利

摘要

本发明公开了一种基于AI大模型的机器人可视化交互控制方法，首先对音频采样结果进行音频预处理，然后将处理后的数据输入到语音识别模型中和AI大模型中，AI大模型将文本分类进行分析处理，判断语音识别结果是智能控制问题还是智能交互问题并分别进行控制或回复，控制命令发送给智能终端设备，回复文本输入语音合成模型，获得合成后的回复音频；合成音频输入AI对口模型中合成数字人交互视频并由AI数字人播报回复内容。本发明将大模型与自然语言音频数据合成为数字人的面部动作，极大的提高了智能交互控制系统的可视化交互效果，同时采用微调大模型实现更好的场景落地，提高了系统的泛化能力，具备多平台智能家居设备控制方法，具有极高的可扩展性。

技术关键词

机器人可视化交互控制方法文本 CTC算法智能家居设备控制方法语音识别模型交互视频深层卷积神经网络音频采样智能机器人概率分布建模统计语言模型交互控制系统语谱图隐马尔可夫模型拼音注意力机制命令

系统为您推荐了相关专利信息

基于数据库和大模型的科技查新报告自动生成方法及系统

报告自动生成方法关键词模块词语同义词

一种核电厂每日状态报告智能推送方法

智能推送方法报告标签数据信息系统

一种应用数据的处理方法以及装置

数据终端设备语义特征语义理解模型监测模块

一种基于脑电的意识障碍智能评估系统

智能评估系统脑电信号分析脑电信号采集模块情景触觉刺激模块

一种基于事件要素提取的语义冲突识别方法及装置

冲突识别方法语义动态条件随机场集成学习策略文本

一种基于AI大模型的机器人可视化交互控制方法

站点导航

APP 下载