一种基于GAN的数字医生表情、动作与情感交互模拟系统

正文

推荐专利

申请号：CN202510693254

申请日期：2025-05-27

公开号：CN120495486A

公开日期：2025-08-15

类型：发明专利

摘要

本发明提供了一种基于GAN的数字医生表情、动作与情感交互模拟系统，包括数据集构建模块、音频编码器、动作掩码编码器、Transformer转换器、训练模块和数字医生生成模块。数据集构建模块用于构建高质量的医疗场景数据集；音频编码器采用预训练模型从音频中提取高级特征表示；动作掩码编码器用于提取与视频帧尺寸相同的二值图像中的动作特征信息；Transformer转换器用于实现多模态数据的融合；训练模块用于对GAN网络进行训练；数字医生生成模块通过训练好的生成器生成逼真的全身动作和表情序列。本发明系统能够根据当前系统中语音对话更准确的生成数字医生的表情和动作，避免传统在线诊疗系统中用户不满意、数字医生表情生成不佳等问题。

技术关键词

模拟系统音频特征医疗场景转换器音频编码器在线诊疗系统视频帧预训练模型模块动作特征注意力机制输出特征数据网络多模态关键点掩码矩阵

系统为您推荐了相关专利信息

一种多通道粒子噪声采集控制器

采集控制器数据处理电路数据采集电路 AD转换器多通道

一种基于负温度系数热敏电阻的海洋剖面温度快速测量的传感器

负温度系数热敏电阻高速模数转换低压差线性稳压器恒流源直流转换器

用于超导量子计算控制、读取和反馈的装置及系统

信号输入模块射频信号输出模块量子芯片时钟同步时钟模块

一种分布式发电并网逆变器的波动抑制改进控制方法

分布式发电并网数学模型坐标系逆变器反步滑模控制

一种多模态生成式对话任务处理方法、装置及设备

音频适配器多模态音频编码器图像特征向量语义

一种基于GAN的数字医生表情、动作与情感交互模拟系统

站点导航

APP 下载