摘要
本发明实施例提供一种基于AI大模型的混合现实内容生成方法、装置以及终端设备,属于人工智能技术领域。该方法包括:采集目标用户对应的初始语音信息和目标用户所处的目标环境对应的初始图像信息和第一三维信息;对初始语音信息进行语音识别获得目标文本信息;根据目标文本信息和初始图像信息进行图像生成获得目标文本信息对应的目标图像信息;根据初始图像信息对目标图像信息进行图像分割获得初始图像信息在目标图像信息中未出现的初始物体信息;对初始物体信息进行虚拟构建获得初始物体信息对应的第二三维信息;根据第一三维信息和第二三维信息进行混合现实内容生成获得初始语音信息对应的混合现实生成结果。
技术关键词
文本生成图像
图像特征信息
图像增强
语音识别模型
内容生成方法
图像特征提取
图像分割
物体
重构模型
参数
特征提取模型
终端设备
预测特征
内容生成装置
图像处理
图像生成网络
图像特征识别
系统为您推荐了相关专利信息
历史商品信息
物流信息管理方法
卷积神经网络模型
样本
物流信息管理设备
图像压缩编码方法
小波变换处理
图像压缩编码装置
像素
图像压缩解码方法
智能语音识别系统
语音控制模块
执行机构
架桥机
语音识别模块
打印执行模块
曲线
鸽群优化算法
控制点
粒子群优化算法
语音识别模型
语音识别方法
语音编码器
样本
单人