摘要
本发明公开了动画视频帧智能选择对话生成系统,具体涉及计算机视觉技术领域,将角色库中的动画视频转换为视频帧序列,使用计算机视觉技术检测每一帧中出现的角色,并进行跟踪,对于检测到的角色,提取其外观特征,将提取的角色的外观特征和角色库中获取的角色外观特征进行匹配,确定检测到的角色的身份,建立一个角色音色库,包括音频数据和已标注的音色,从音频数据中提取音频特征并进行音色识别,将识别出的音色与预先标注的角色音色进行匹配,根据音色识别结果,将每个角色的对话内容抽取出来,并将对话内容转换成文本形式,对抽取出的对话内容进行主题相似度判断,根据判断结果,将具有相似主题的对话内容进行修改,以生成新的对话内容。
技术关键词
对话生成系统
角色外观
视频帧
主题
计算机视觉技术
动画
自然语言
身份
文本
音频特征
词嵌入技术
语音识别技术
度计算方法
颜色直方图
识别模块
机器学习算法
音色特征