摘要
本公开提供了训练信息生成模型的方法、生成辅助信息的方法及相关装置,涉及信息生成、深度学习、智慧医疗等人工智能技术领域。训练信息生成模型的一具体实施方式包括:以第一样本病历为医疗辅助信息生成模型的输入,针对第一样本病历的奖励函数为监督,通过近端策略优化算法多轮次地训练医疗辅助信息生成模型,其中,奖励函数基于模型处理结果与样本病历对应的标准处理结果之间的差异被确定,模型处理结果由医疗辅助信息生成模型处理第一样本病历得到;响应于奖励函数在目标训练轮次所具有的函数值大于或者等于预先确定的函数值阈值,完成对医疗辅助信息生成模型的训练,得到目标医疗辅助信息生成模型。由此,不仅能够降低医疗辅助信息生成模型的训练过程中的资源消耗,还能够稳定训练过程,训练出更具性能的医疗辅助信息生成模型。
技术关键词
病历
样本
语义
生成指令
信息更新
人工智能技术
计算机程序产品
处理器通信
策略
算法
可读存储介质
存储器
电子设备
资源