摘要
本发明涉及数据处理技术领域,公开一种术语对齐语言生成方法、装置、设备及介质,可应用于金融、医疗领域,该方法包括构建输入环境数据;将输入环境数据输入至语言生成模型,得到候选响应集合;构建术语对齐奖励函数并对候选响应集合中的各个候选语言响应进行评分,得到评分结果;筛选得分最高的候选语言响应作为最终输出响应;利用最终输出响应更新语言生成模型的策略参数,得到语言生成结果。在本发明中,针对现有的大语言模型的术语对齐与表述规范方面存在明显不足的问题,可以构建术语对齐奖励函数,并评分筛选出最终输出响应,以更新策略参数,得到语言生成结果,如此,提高了语言生成过程中强化术语的合规性以及话术对齐能力。
技术关键词
语言生成方法
术语
预训练语言模型
覆盖率
语义
数据输入模块
策略
可读存储介质
数据处理技术
数据采集模块
意图识别
处理器
指标
检测工具
词语
生成装置
合规性