摘要
本发明公开一种基于手机视频电话的多模态AI交互系统及方法,包括通信终端、呼叫中心模块、多模态逻辑处理模块和动态内容生成模块,通信终端与呼叫中心模块之间由运营商通信网络连接,呼叫中心模块用于处理大量电话的呼入呼出,呼叫中心模块包括SIP协议网关单元、视频交互传输单元和声音交互传输单元,多模态逻辑处理模块用于识别理解用户语义,提取用户视频中对当前业务有价值的信息,动态内容生成模块用于根据用户语义生成音视频进行交互;本发明通过基于现有的呼叫中心结合多模态逻辑处理和动态内容生成进行扩展,使其增加了智能视频客服的能力,可以处理更多复杂问题,有效解决了传统IVR系统,不能和AI进行交互,只能处理简单的业务的问题。
技术关键词
呼叫中心
视频电话
通信终端
传输单元
交互系统
网关单元
交互方法
语音识别单元
模块
双向音视频传输
逻辑分析
手机
视频识别
动态
识别用户语音
交叉注意力机制
IVR系统
系统为您推荐了相关专利信息
交互系统
多模态
微动特征
多尺度特征提取
交互内容
智能语音交互系统
查询关键词
文本
转换单元
智能语音交互方法
人机交互系统
蠕动泵
驱动控制模块
流量校准方法
通信接口
智能机器人
情感识别技术
诊断模块
识别模块
物联网设备监控