基于多模态数据的个性化视听融合智能交互系统及其使用方法

正文

推荐专利

申请号：CN202411491891

申请日期：2024-10-24

公开号：CN119399371A

公开日期：2025-02-07

类型：发明专利

摘要

本申请公开了一种基于多模态数据的个性化视听融合智能交互系统及其使用方法，该系统包括多模态数据接收模块、面部特征提取模块、三维模型生成模块、音频特征提取模块、虚拟音声生成模块、虚拟形象整合模块以及交互模块。用户通过上传图片、视频和音频，系统提取面部和音频特征，生成虚拟形象和虚拟音声，并进行整合适配。交互模块展示虚拟形象，用户输入对话内容，系统通过算法生成回复，并通过虚拟形象进行视频和音频交互。能够实现基于多模态数据的虚拟形象与声音生成及交互，从而提供高度个性化和智能化的用户体验。不仅能够生成高度逼真的虚拟形象和音声，还能通过智能交互模块实现自然流畅的用户互动，大大提升了用户体验的质量和满意度。

技术关键词

智能交互系统多模态数据接收模块面部特征音频特征提取数据预处理功能人像信息视听特征提取模块视频生成虚拟形象智能交互模块情感识别技术智能算法语音特征提取

系统为您推荐了相关专利信息

数据处理方法、装置及程序产品

人脸特征数据数据处理方法静态特征办理金融业务采集人脸图像

一种工业自动设备数字可视化控制方法及系统

工业自动设备可视化控制方法语义关联网络语义实体融合多任务

基于科技项目全生命周期的文档审查方法、设备及介质

项目全生命周期树状结构数据大语言模型科技文档分类

一种面向大模型的私域知识库构建及权限控制方法

权限控制方法权限认证系统理解自然语言细粒度权限登录系统

一种多模态生理信号采集设备的抗干扰滤波方法、系统、终端及存储介质

抗干扰滤波方法生理信号采集设备多模态生理滤波结构生理信号处理技术

基于多模态数据的个性化视听融合智能交互系统及其使用方法

站点导航

APP 下载