基于大模型的语音风格识别系统

AITNT
正文
推荐专利
基于大模型的语音风格识别系统
申请号:CN202411919730
申请日期:2024-12-25
公开号:CN119360830B
公开日期:2025-03-04
类型:发明专利
摘要
本申请涉及智能语音识别领域,其具体地公开了一种基于大模型的语音风格识别系统,其通过接收由麦克风采集的目标用户的语音输入信号,然后从中提取出梅尔频谱,并采用基于深度学习和大模型的信号分析和处理技术来对提取出的语音输入信号梅尔频谱图进行分块处理和多尺度语义编码,以此根据编码得到的各个上下文梅尔频谱局部编码特征之间的动力学特征聚合表示来智能地生成语音风格识别播报语音。通过该方式,系统能够确保复杂风格得到充分表征,并且能够更好地适应不同说话人在发音方式、语速、音调等方面的显著差异,提高泛化能力。
技术关键词
频谱特征 编码特征 识别系统 风格 序列 度量 分块 智能语音识别 编码向量 因子 编码模块 转换器结构 信号采集模块 多尺度 生成语音 麦克风 信号分析
系统为您推荐了相关专利信息
1
融合伪3D人工标注与2D目标跟踪的图像数据标注方法
质心偏移量 数据标注方法 物体 索引 图像
2
一种细胞外囊泡中microRNA提取和检测的整合方法
荧光标记探针 RNA保护剂 粒度分析仪 建立检测模型 微流控芯片
3
一种批量任务耗时预警方法、设备、介质及程序产品
预警方法 批量 序列 时序 周期性
4
基于SVM与BiLSTM模型的超导电缆故障预测方法
故障预测方法 故障预测模型 超导电缆 计算机可读指令 注意力
5
基于动态自适应分块和子图同构的量子比特映射算法
比特映射算法 深度优先搜索算法 分块 反转技术 序列
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号