摘要
本发明实施例公开了一种剧集解说文本生成方法、装置、设备及介质。所述方法包括:通过文字识别模型对待解说视频识别出的台词文本进行格式转换获取字幕文件;通过对所述待解说视频的音频进行特征提取获取所述台词文本所对应的音频特征,将所述音频特征通过预设分类器进行性别分类以获取台词分类文本;将所述字幕文件与所述台词分类文本输入至大语言模型中,根据所述大语言模型与预先选择的目标解说风格生成目标解说文本。通过实施本发明实施例的方法可解决现有技术中无法对剧集有效生成个性化的解说文本的问题。
技术关键词
大语言模型
音频特征
字幕
文本生成方法
风格
视频识别
多模态数据处理方法
梅尔频率倒谱系数
格式转换方法
文本生成装置
分类器
关键词
计算机设备
时间段
转换单元
处理器
系统为您推荐了相关专利信息
大语言模型
语句
数据分析方法
报表需求
计算机程序产品
人型机器人
人形机器人
转换方法
奖励系统
控制器模块
语音识别置信度
文本
语音识别方法
列表
大语言模型