语音合成场景的大模型提示信息筛选方法、装置、设备及介质

AITNT
正文
推荐专利
语音合成场景的大模型提示信息筛选方法、装置、设备及介质
申请号:CN202510037565
申请日期:2025-01-09
公开号:CN119889277B
公开日期:2025-10-31
类型:发明专利
摘要
本申请适用于人工智能技术领域,尤其涉及一种语音合成场景的大模型提示信息筛选方法、装置、设备及介质,该方法通过对语音库中的初始提示语音进行静态质量检测,提前完成对初始提示语音质量的评估,并挑选出质量较高的初始提示语音用于提示大模型进行语音合成任务。同时,还考虑到初始提示语音和语音合成文本之间的语义相似度,从而动态地从候选提示语音中选择最符合语音合成文本语义的目标提示语音。如此,筛选得到的目标提示语音具有较高的质量,且符合语音合成文本的语义,提高了大模型语音合成的准确率,从而使得在金融场景、医疗场景下的大语言模型输出效果更好的语音合成结果。
技术关键词
语音 情感类别 筛选方法 文本 大语言模型 语义 错误率 医疗场景 可读存储介质 人工智能技术 处理器 筛选装置 计算机设备 模块 字符 音频 存储器
系统为您推荐了相关专利信息
1
基于开源鸿蒙系统的智能摄像头语音交互控制系统及方法
智能摄像头 语音交互控制系统 语音交互控制方法 音频驱动模块 指令执行单元
2
一种基于人脸识别的医院叫号系统
医院 识别患者 视角 人脸识别技术 标记
3
评论质量的提高方法、装置、设备、介质和程序产品
大语言模型 文本特征向量 音频特征 主题 关键词
4
短时记忆操纵能力的训练方法及相关产品
图片 对象 实体 复杂度 大语言模型
5
一种文件编排处理方法与系统
格式 任务调度机制 文本理解 数据 字体
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号