摘要
本申请公开了一种实现面对面与人交流的AI动画数字人装置及方法,通过结合声音定位、红外激光测距和人脸识别技术,成功解决了背景技术中提到的虚拟数字人与用户交互中缺乏自然性和沉浸感的问题。通过麦克风单元与红外激光测距传感器,装置能够准确定位声源位置并测量物体与显示屏之间的距离,避免了传统语音识别技术受环境噪声干扰的局限性。结合YOLO算法和FaceNet深度学习模型,装置可以实时识别用户面部特征,并精确定位眼睛位置,实现了数字人眼睛与用户眼睛的同步对视。当用户移动时,装置通过计算用户的精确物理位置并调整数字人眼睛朝向,确保数字人始终与用户保持正面面对的状态。
技术关键词
麦克风单元
显示屏
人脸特征信息
YOLO算法
激光测距传感器
眼睛
动画
麦克风阵列
模拟鼠标
深度学习模型
TDOA算法
坐标转换算法
环境噪声干扰
时间差
上边框
人脸特征点
语音识别技术
人脸识别技术
系统为您推荐了相关专利信息
自然语言处理程序
图像识别程序
移动滑轨
学生
支撑座
带式输送机
调节控制系统
信息采集模块
影像采集设备
数据处理模块
心肺复苏教学模型
模型主体
按压组件
锥形套
压力传感器
移动支架
人证比对装置
升降机构
文件存放架
人脸识别摄像头
电压适配电路
低压输出电路
开关二极管
高压输出电路
电源芯片