摘要
本发明公开了一种字幕及其显示图形实时生成系统,涉及字幕生成技术领域,包括音视频导入模块、音频提取模块、语音转换模块、角色识别模块、情感识别模块、字体图形模块、字幕显示控制模块、字幕图形控制模块;该字幕及其显示图形实时生成系统,通过设置音视频导入模块、音频提取模块、语音转换模块、角色识别模块、情感识别模块等,可识别出角色的情感,并使用设置的不同的字体和装饰图形,显示、装饰不同情感的字幕,使得观众可通过字幕了解角色的情感,更具趣味性;控制每个字幕的字数,基于时间间隔控制弹幕显示的位置,使得每个字幕信息不会过长,并保证了每个字幕信息的显示时间,保证观众来得及观看。
技术关键词
情感识别模型
音频
识别模块
生成系统
显示控制模块
面部特征
音视频
深度学习模型
识别码
语音识别算法
字体
标签
样式
端点检测算法
装饰
检测字幕
图像
系统为您推荐了相关专利信息
事件特征
频域特征
时序特征
方向盘转向角度
识别驾驶员身份
路径规划系统
RRT算法
图像拍摄设备
全局路径规划
视觉
语音识别方法
麦克风阵列
会议设备
音频
语音唤醒模型