基于声纹的动画角色智能同步用户方法

AITNT
正文
推荐专利
基于声纹的动画角色智能同步用户方法
申请号:CN202411076672
申请日期:2024-08-07
公开号:CN119048650A
公开日期:2024-11-29
类型:发明专利
摘要
本发明涉及基于声纹的动画角色智能同步用户方法,具体涉及多模态数据处理领域,利用高清摄像头采集用户形象数据,并对用户形象数据进行缩放、像素点位置的匹配和填充,通过直方图均衡化增强图像对比度,利用高斯滤波加权对用户形象数据存在噪声进行去除,使用户形象数据在固定尺寸下保持清晰,并且细节丰富,构建卷积神经网络基于动画的主色调和角色形象输出最终的用户虚拟形象,利用麦克风采集用户声纹数据,通过傅里叶变换对每个窗口的声音信号进行频谱表示,构建Transformer编码器并添加自注意力机制和前馈神经网络,将用户虚拟形象和用户声纹转换的动画语音进行同步并自动替换,为用户提供更加个性化和沉浸式的交互体验。
技术关键词
面部关键点 动画 构建卷积神经网络 前馈神经网络 直方图均衡化 注意力机制 像素点 数据 高清摄像头 语音 麦克风 编码器结构 滤波 信号 对比度 索引 噪声 邻域 坐标
系统为您推荐了相关专利信息
1
一种基于语义分割的水网系统数字化映射方法及系统
语义分割模型 映射方法 水网系统 直方图均衡化方法 多尺度卷积核
2
一种融合时序信息的车路协同3D目标检测方法
融合时序信息 卡尔曼滤波器 匈牙利算法 信号 轨迹
3
一种用于水电厂维修区域的智能亮度调节控制方法及系统
智能亮度调节 逻辑回归模型 模糊逻辑 多参数关联分析 能耗
4
一种基于超声导波的架空地线腐蚀评估方法、系统、设备及介质
超声导波 深度学习模型 地线 传感器布置 信号采集模块
5
基于密集几何交互感知的动作重定向方法、装置、电子设备及存储介质
动作重定向方法 特征点 网格 交互特征 交互模型
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号