摘要
本发明公开了一种基于AI语音交互的笔录自动生成方法,属于语音分析技术领域,包括:获取原始语音数据,通过预设的音频采集模块从目标环境录制连续音频流,采用时域分割技术生成初步划分的语音片段集合;针对所述语音片段集合,提取音调特征、语速变化和音量特征,生成语音特征集;将所述语音特征集输入深度神经网络模型,通过多维特征映射确定情绪标签,生成带有情绪标签的语音单元集;若语音单元集的语音类型为陈述类型,则采用叙述式模板生成文本;若语音单元集的语音类型为问询类型,则采用问询式模板生成文本;得到格式化笔录。所述基于AI语音交互的笔录自动生成方法解决了现有的笔录生成方式难以生成格式规范且信息丰富的笔录的问题。
技术关键词
自动生成方法
AI语音
语音特征
深度神经网络模型
音频采集模块
标签
主成分分析技术
梅尔频率倒谱系数
语音分析技术
生成语音
端点检测算法
傅里叶变换处理
格式化
文本
模板
高斯混合模型
生成方式
带时间
系统为您推荐了相关专利信息
音频
噪声特征
麦克风阵列采集
初始时间间隔
空间分布特征
信息判断驾驶员
面部
驾驶员疲劳驾驶
车辆行驶信息
提醒方法
说话人识别方法
说话人识别准确性
说话人身份识别
语音特征
深度神经网络模型