语义协同虚拟主播视频生成方法、装置、设备及介质

AITNT
正文
推荐专利
语义协同虚拟主播视频生成方法、装置、设备及介质
申请号:CN202510448207
申请日期:2025-04-10
公开号:CN120201261A
公开日期:2025-06-24
类型:发明专利
摘要
本发明涉及语音语义技术领域,可应用于金融科技及医疗健康等业务系统平台中,揭露了一种语义协同虚拟主播视频生成方法、装置、设备及介质,所述方法包括:获取虚拟主播模板视频,对虚拟主播模板视频的每帧图像中动作和文本之间的关联特征进行分析,得到图像关联特征,获取初始用户文本,识别初始用户文本的多维文本情感,利用多维文本情感对初始用户文本进行内容扩展,得到更新用户文本,利用更新用户文本生成用户文本音频,将图像关联特征、更新用户文本和用户文本音频进行加权融合,得到虚拟主播特征,利用虚拟主播特征对虚拟主播模板视频进行更新,得到虚拟主播完整视频。本发明可以有效提高虚拟主播视频中文本、音频和虚拟主播动作的一致性。
技术关键词
文本 视频生成方法 语义协同 音频 图像 面部特征点 生成用户 模板 关键点 注意力 语音语义技术 噪声样本 情感特征 坐标 编码向量 视频生成装置 矩阵 处理器
系统为您推荐了相关专利信息
1
基于知识推理的实体形象识别方法、装置、存储介质及电子设备
文本 三元组 数据处理模块 注意力 命名实体识别
2
情感识别与情感图像生成方法及装置
标识 图像生成方法 情感识别模型 样本 物体
3
车轮悬架控制方法、装置、系统、存储介质及程序产品
车轮悬架 方向盘转角信息 加速度 车辆前方图像 车身
4
一种基于多光谱红外与可见光成像的火炬燃烧监测与优化控制系统
燃烧状态参数 优化控制系统 多光谱成像 火炬 可见光图像
5
一种检测印刷设备运行状态的方法
印刷设备 在线检测系统 印刷品 激光检测机构 AI人工智能
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号