摘要
本发明涉及语音识别技术领域,具体涉及一种基于AI的多线益智互动方法及玩具,方法包括:建立语音互动识别会话并在接收开始指令后初始化;连续接收音频片段写入语音特征缓冲区;对片段提取帧级特征入缓冲,当累计超过第一数值长度,提取该长度的序列为批次,并获取其后的第二数值作为右侧上下文;按第三数值将批次切分为子块,并为每块拼接左右上下文形成CSC序列,组合为CSC特征矩阵送入声学模型并行计算声学分数;基于分数以语音活动检测模型检测短暂停顿,触发回溯、阶段性输出与状态重置;再以维特比结合语言模型搜索得到最终识别文本。本发明可以解决智能玩具语音互动中响应时延长、多人并发易串线与停顿误判导致的交互不连贯问题。
技术关键词
神经网络声学模型
互动方法
双向长短期记忆
语音活动检测
分块特征
序列
音频
语音特征提取
益智互动玩具
数值
上下文特征
存储计算机可执行指令
解码
数据传输开销
多通道并行
语音识别技术
分块策略
深度神经网络
系统为您推荐了相关专利信息
排水管道
智能预测方法
模拟模型
方程
长短记忆神经网络
主题关键词
互动方法
文本
主题模型
关键词提取模型
车牌识别系统
生成对抗网络
双分支卷积神经网络
神经网络混合模型
可变形卷积层
髋关节置换术
提示系统
声音采集模块
声学特征
频域特征分析
北斗卫星导航系统
地磁活动指数
深度学习模型
电子
数据