语音合成场景的大模型提示信息筛选方法、装置、设备及介质

正文

推荐专利

申请号：CN202510037565

申请日期：2025-01-09

公开号：CN119889277B

公开日期：2025-10-31

类型：发明专利

摘要

本申请适用于人工智能技术领域，尤其涉及一种语音合成场景的大模型提示信息筛选方法、装置、设备及介质，该方法通过对语音库中的初始提示语音进行静态质量检测，提前完成对初始提示语音质量的评估，并挑选出质量较高的初始提示语音用于提示大模型进行语音合成任务。同时，还考虑到初始提示语音和语音合成文本之间的语义相似度，从而动态地从候选提示语音中选择最符合语音合成文本语义的目标提示语音。如此，筛选得到的目标提示语音具有较高的质量，且符合语音合成文本的语义，提高了大模型语音合成的准确率，从而使得在金融场景、医疗场景下的大语言模型输出效果更好的语音合成结果。

技术关键词

语音情感类别筛选方法文本大语言模型语义错误率医疗场景可读存储介质人工智能技术处理器筛选装置计算机设备模块字符音频存储器

系统为您推荐了相关专利信息

基于开源鸿蒙系统的智能摄像头语音交互控制系统及方法

智能摄像头语音交互控制系统语音交互控制方法音频驱动模块指令执行单元

一种基于人脸识别的医院叫号系统

医院识别患者视角人脸识别技术标记

评论质量的提高方法、装置、设备、介质和程序产品

大语言模型文本特征向量音频特征主题关键词

短时记忆操纵能力的训练方法及相关产品

图片对象实体复杂度大语言模型

一种文件编排处理方法与系统

格式任务调度机制文本理解数据字体

语音合成场景的大模型提示信息筛选方法、装置、设备及介质

站点导航

APP 下载