一种剧集解说文本生成方法、装置、设备及介质

正文

推荐专利

申请号：CN202410878461

申请日期：2024-07-02

公开号：CN118734804A

公开日期：2024-10-01

类型：发明专利

摘要

本发明实施例公开了一种剧集解说文本生成方法、装置、设备及介质。所述方法包括：通过文字识别模型对待解说视频识别出的台词文本进行格式转换获取字幕文件；通过对所述待解说视频的音频进行特征提取获取所述台词文本所对应的音频特征，将所述音频特征通过预设分类器进行性别分类以获取台词分类文本；将所述字幕文件与所述台词分类文本输入至大语言模型中，根据所述大语言模型与预先选择的目标解说风格生成目标解说文本。通过实施本发明实施例的方法可解决现有技术中无法对剧集有效生成个性化的解说文本的问题。

技术关键词

大语言模型音频特征字幕文本生成方法风格视频识别多模态数据处理方法梅尔频率倒谱系数格式转换方法文本生成装置分类器关键词计算机设备时间段转换单元处理器

系统为您推荐了相关专利信息

人脸情绪检测方法、系统、终端及存储介质

人脸情绪融合特征视觉特征提取矩阵视频流

数据分析方法、装置、电子设备和计算机程序产品

大语言模型语句数据分析方法报表需求计算机程序产品

一种用于多模态金融文档合规分析的RAG方法及系统

文本语句多模态金融多路径

一种人形机器人自适应步态转换方法

人型机器人人形机器人转换方法奖励系统控制器模块

语音识别方法及存储介质

语音识别置信度文本语音识别方法列表大语言模型

一种剧集解说文本生成方法、装置、设备及介质

站点导航

APP 下载