一种残疾人直播带货的辅助音视频生成系统及方法

正文

推荐专利

申请号：CN202411885091

申请日期：2024-12-20

公开号：CN120151553A

公开日期：2025-06-13

类型：发明专利

摘要

本发明公开了一种残疾人直播带货的辅助音视频生成系统及方法，包括包括直播语音模型和直播视频模型；所述直播语音模型包括语义理解单元、语义标记单元和语音生成单元。本发明通过识别残疾人语音对残疾人语音进行替换，以克服残疾人由于和人沟通少导致出现的停顿、错字、漏字或缺少情感导致的直播效果较差的问题，还可以根据当前视频实时生成商品展示的动画，从而克服部分残疾人由于肢体残疾导致的不便展示商品使用状态的问题。

技术关键词

生成系统标记单元 Softmax函数人脸身份语义音视频生成方法面部特征位置编码器文本编码器大语言模型序列语音特征音频

系统为您推荐了相关专利信息

用于路线规划的使用语义图信息的路点图生成

语义移动机器人虚拟现实内容协作内容规划

基于大语言模型生成测试用例的方法、装置和设备

生成测试用例大语言模型非易失性计算机可读存储介质计算机程序指令测试用例关联

一种AI门诊分诊系统

分诊系统分诊方法智能分诊人机交互模块 BERT模型

一种领域自适应的检索增强生成方法及系统

大语言模型语义理解模型生成方法生成系统样本

图纸处理方法、设备、介质及产品

图纸计算机程序指令多尺度特征坐标文本

一种残疾人直播带货的辅助音视频生成系统及方法

站点导航

APP 下载