摘要
本申请适用于人工智能技术领域,尤其涉及一种语音合成场景的大模型提示信息筛选方法、装置、设备及介质,该方法通过对语音库中的初始提示语音进行静态质量检测,提前完成对初始提示语音质量的评估,并挑选出质量较高的初始提示语音用于提示大模型进行语音合成任务。同时,还考虑到初始提示语音和语音合成文本之间的语义相似度,从而动态地从候选提示语音中选择最符合语音合成文本语义的目标提示语音。如此,筛选得到的目标提示语音具有较高的质量,且符合语音合成文本的语义,提高了大模型语音合成的准确率,从而使得在金融场景、医疗场景下的大语言模型输出效果更好的语音合成结果。
技术关键词
语音
情感类别
筛选方法
文本
大语言模型
语义
错误率
医疗场景
可读存储介质
人工智能技术
处理器
筛选装置
计算机设备
模块
字符
音频
存储器
系统为您推荐了相关专利信息
智能摄像头
语音交互控制系统
语音交互控制方法
音频驱动模块
指令执行单元