摘要
本发明涉及基于AI多模态大模型的智能对话系统及方法,所述方法包括实时采集用户的生物特征数据;利用对抗生成网络克隆用户的个性化表达模式;驱动音频分身与用户进行多轮对话交互,并通过表情识别模块捕捉用户实时生理信号,结合对话上下文生成动态应答内容建议;基于强化学习模型分析交互过程。本发明实现了语音韵律特征、语言结构特征及面部动态特征的多模态深度融合,从而突破了现有技术中单模态或简单特征拼接的局限,能够精准且全面地捕捉用户的情感状态、表达意图及细微的生理反应,为构建高保真用户表征奠定了坚实基础。
技术关键词
智能对话方法
生物特征数据
表情管理
行业知识图谱
智能对话系统
多轮对话
语音
声学全息
文本
视频流
强化学习模型
动态时间规整算法
面部
样本
韵律特征
冗余度
依存句法分析
标记
指标
频率