一种基于AI大模型的机器人可视化交互控制方法

AITNT
正文
推荐专利
一种基于AI大模型的机器人可视化交互控制方法
申请号:CN202411473048
申请日期:2024-10-22
公开号:CN119479640A
公开日期:2025-02-18
类型:发明专利
摘要
本发明公开了一种基于AI大模型的机器人可视化交互控制方法,首先对音频采样结果进行音频预处理,然后将处理后的数据输入到语音识别模型中和AI大模型中,AI大模型将文本分类进行分析处理,判断语音识别结果是智能控制问题还是智能交互问题并分别进行控制或回复,控制命令发送给智能终端设备,回复文本输入语音合成模型,获得合成后的回复音频;合成音频输入AI对口模型中合成数字人交互视频并由AI数字人播报回复内容。本发明将大模型与自然语言音频数据合成为数字人的面部动作,极大的提高了智能交互控制系统的可视化交互效果,同时采用微调大模型实现更好的场景落地,提高了系统的泛化能力,具备多平台智能家居设备控制方法,具有极高的可扩展性。
技术关键词
机器人可视化 交互控制方法 文本 CTC算法 智能家居设备控制方法 语音识别模型 交互视频 深层卷积神经网络 音频采样 智能机器人 概率分布建模 统计语言模型 交互控制系统 语谱图 隐马尔可夫模型 拼音 注意力机制 命令
系统为您推荐了相关专利信息
1
基于数据库和大模型的科技查新报告自动生成方法及系统
报告自动生成方法 关键词 模块 词语 同义词
2
一种核电厂每日状态报告智能推送方法
智能推送方法 报告 标签 数据 信息系统
3
一种应用数据的处理方法以及装置
数据 终端设备 语义特征 语义理解模型 监测模块
4
一种基于脑电的意识障碍智能评估系统
智能评估系统 脑电信号分析 脑电信号采集模块 情景 触觉刺激模块
5
一种基于事件要素提取的语义冲突识别方法及装置
冲突识别方法 语义 动态条件随机场 集成学习策略 文本
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号