摘要
本发明公开了一种基于数字人的人工智能通识大模型训练方法及系统,其中方法包括采集所有数字人的所有多模态样本数据,根据所有文本模态数据、音频模态数据构建文本识别关键向量、音频识别关键向量,计算文本模式深化指数、音频模式深化指数,根据所有图像模态数据构建图像识别关键向量,计算图像变异因子,获取图像模式深化指数,基于文本模式深化指数、图像模式深化指数、音频模式深化指数以及文本识别关键向量、图像识别关键向量、音频识别关键向量训练人工智能通识大模型。本发明实施例将数字人的文本、语音、图像信息有效地融合在一起,提高了人工智能通识大模型的综合能力和适应性。
技术关键词
文本识别
音频
指数
模型训练方法
图像
模式
因子
数据
序列
灰度共生矩阵
纹理结构
关键词
模型训练系统
直方图
多模态
格式
词语
处理器
系统为您推荐了相关专利信息
移动底座
抓取机器人
基座坐标系
PID控制算法
工件抓取方法
显示切换功能
图像处理器
操作系统
显示内容控制方法
显示内容控制系统
散热优化方法
深度强化学习
深度学习模型
风冷电机
时间段
可见光图像
图像配准模型
配准方法
红外图像特征
深层特征提取