一种基于多模态情感识别和定制化人像生成的机器人拟人化交互方法

正文

推荐专利

申请号：CN202510696579

申请日期：2025-05-28

公开号：CN120669850A

公开日期：2025-09-19

类型：发明专利

摘要

本发明公开了一种基于多模态情感识别和定制化人像生成的机器人拟人化交互方法，包含以下步骤：步骤S1：多模态情感动态融合；通过多源异构传感器同步采集语音、视觉及文本信号，高保真麦克风阵列捕获用户语音流，提取语调、语速等声学特征，步骤S2：跨模态推理；步骤S3：内容同步生成；步骤S4：风格迁移；步骤S5：拟人化语音和表情生成；本发明利用大语言模型和多模态信息融合对人机交互的情感进行分析和生成，避免了交互情感的单一和共情能力的欠缺，具有强情感交互特性，通过生成式技术获取机器人的形象，并能够迁移至任意形象，打破了特定形象独门独造的局限，实现了一台机器人能适用于不同场景的优势。

技术关键词

视频内容特征拟人化交互方法多模态情感识别个性化头像面部高保真麦克风语音声学特征风格文本视觉跨模态控制解码器机器人查询特征大语言模型编码器异构传感器语义向量多模态信息

系统为您推荐了相关专利信息

一种神经内科患者身体指标监测系统

指标监测系统患者智能光照调节个性化健康建议面部表情识别

基于脑机数据和面部表情识别的动态难度调整技术的儿童科普游戏

面部表情识别巴特沃斯滤波器记忆单元游戏参数个性化学习路径

基于多模态感知与动态评估的沉浸式虚拟教学系统

虚拟教学系统教学场景数据处理模块数据采集模块注意力

一种基于人脸识别的充电桩智能控制方法及系统

智能控制方法面部验证用户身份充电桩智能控制系统表达式

一种基于多传感器的非接触式疲劳检测方法及系统

驾驶员面部表情车辆运动数据轻量级神经网络疲劳检测方法视觉摄像头

一种基于多模态情感识别和定制化人像生成的机器人拟人化交互方法

站点导航

APP 下载