一种基于数字人的人工智能通识大模型训练方法及系统

正文

推荐专利

申请号：CN202411569705

申请日期：2024-11-06

公开号：CN119089206B

公开日期：2025-02-28

类型：发明专利

摘要

本发明公开了一种基于数字人的人工智能通识大模型训练方法及系统，其中方法包括采集所有数字人的所有多模态样本数据，根据所有文本模态数据、音频模态数据构建文本识别关键向量、音频识别关键向量，计算文本模式深化指数、音频模式深化指数，根据所有图像模态数据构建图像识别关键向量，计算图像变异因子，获取图像模式深化指数，基于文本模式深化指数、图像模式深化指数、音频模式深化指数以及文本识别关键向量、图像识别关键向量、音频识别关键向量训练人工智能通识大模型。本发明实施例将数字人的文本、语音、图像信息有效地融合在一起，提高了人工智能通识大模型的综合能力和适应性。

技术关键词

文本识别音频指数模型训练方法图像模式因子数据序列灰度共生矩阵纹理结构关键词模型训练系统直方图多模态格式词语处理器

系统为您推荐了相关专利信息

基于视觉导航的工件抓取方法、机器人、系统及存储介质

移动底座抓取机器人基座坐标系 PID控制算法工件抓取方法

显示内容控制方法及相关装置

显示切换功能图像处理器操作系统显示内容控制方法显示内容控制系统

基于深度强化学习的电动飞机散热优化方法

散热优化方法深度强化学习深度学习模型风冷电机时间段

基于模态转换的红外与可见光图像配准方法及系统

可见光图像图像配准模型配准方法红外图像特征深层特征提取

一种基于层次压缩的3DGS语义场解耦重建方法

语义特征多视角索引压缩特征图像

一种基于数字人的人工智能通识大模型训练方法及系统

站点导航

APP 下载