摘要
本申请提供了宠物语音翻译方法、系统、电子设备及存储介质,其中方法,通过采集高质量的宠物叫声音频样本,提取声学特征并构建深度学习模型,实现对宠物情绪状态的准确识别。结合宠物品种、年龄等信息,能够推断宠物的意图和需求,并从语句库中选择合适的安抚语句。通过深度神经网络技术,生成与宠物叫声音色和情感相似的合成语音,实现个性化的语音交互。实现人与宠物的语音交互,通过对宠物的叫声进行转换成语音,饲主可及时、准确地获知宠物当前需求,从而更快地满足宠物的当前需求。
技术关键词
语音翻译方法
音频
声学特征
长短期记忆网络
宠物穿戴装置
意图
环境参数传感器
门控循环单元
样本
深度神经网络技术
语句
拾音装置
结构化数据格式
环境传感器数据
Softmax函数
语音翻译系统
估计背景噪声
隐马尔可夫模型