摘要
本申请涉及直播带货技术领域,尤其涉及一种基于人工智能的直播带货商品推送方法,包括:基于头部区域图像、服装区域图像以及体型区域图像融合生成当前帧的虚拟主播图像;将当前帧的所述虚拟主播图像拼接到直播间背景图像中,得到虚拟直播视频帧;获取待推送服装数据,将所述待推送服装数据输入语音合成模型,预测得到直播语音数据;将所述推送语音数据和所述虚拟直播视频帧进行对齐,实时生成直播视频流;发送所述直播视频流到服务器端进行直播推流。本申请将虚拟主播图像划分为体型区域、服装区域以及头部区域,将服装区域图像和头部区域图像拼接到体型区域图像的图层上方,生成完整的虚拟主播图像,快速生成虚拟主播图像用于直播推流。
技术关键词
商品推送方法
服装
体型
视频帧
视频流
图像拼接
网格
图像分割
语音
轮廓特征提取
数据
轮廓识别
大语言模型
文本
全景图
编码器
中心线
人体
系统为您推荐了相关专利信息
视频异常检测方法
预测误差
短时间
多尺度特征提取
注意力
启停方法
生理
Copula函数
XGBoost算法
信号