摘要
本发明涉及基于声纹的动画角色智能同步用户方法,具体涉及多模态数据处理领域,利用高清摄像头采集用户形象数据,并对用户形象数据进行缩放、像素点位置的匹配和填充,通过直方图均衡化增强图像对比度,利用高斯滤波加权对用户形象数据存在噪声进行去除,使用户形象数据在固定尺寸下保持清晰,并且细节丰富,构建卷积神经网络基于动画的主色调和角色形象输出最终的用户虚拟形象,利用麦克风采集用户声纹数据,通过傅里叶变换对每个窗口的声音信号进行频谱表示,构建Transformer编码器并添加自注意力机制和前馈神经网络,将用户虚拟形象和用户声纹转换的动画语音进行同步并自动替换,为用户提供更加个性化和沉浸式的交互体验。
技术关键词
面部关键点
动画
构建卷积神经网络
前馈神经网络
直方图均衡化
注意力机制
像素点
数据
高清摄像头
语音
麦克风
编码器结构
滤波
信号
对比度
索引
噪声
邻域
坐标
系统为您推荐了相关专利信息
语义分割模型
映射方法
水网系统
直方图均衡化方法
多尺度卷积核
融合时序信息
卡尔曼滤波器
匈牙利算法
信号
轨迹
智能亮度调节
逻辑回归模型
模糊逻辑
多参数关联分析
能耗
超声导波
深度学习模型
地线
传感器布置
信号采集模块