摘要
本申请公开了一种基于大模型的端侧翻译方法、装置、设备及存储介质,涉及模型优化技术领域,本申请的方法包括:获取目标应用场景的翻译语料库,所述目标应用场景为移动终端侧翻译场景;根据所述翻译语料库对预训练模型进行训练,得到端侧翻译模型;根据预设裁剪策略对所述端侧翻译模型进行结构化裁剪,得到轻量化模型;根据预设部署策略部署所述轻量化模型,并根据所述轻量化模型对输入文本进行翻译。本申请通过数据收集、模型训练、结构化裁剪及量化部署策略,完成了将大模型端侧翻译落地到移动终端中,解决了网络延迟、数据隐私以及端侧资源限制问题,提高了翻译的即时性和准确性。
技术关键词
翻译模型
策略
场景
翻译语言
移动终端
模型优化技术
框架
机器翻译方法
数据收集模块
字符
阶段
模型训练模块
翻译设备
翻译装置
裁剪模块
编解码器
文本
处理器
可读存储介质
系统为您推荐了相关专利信息
任务分配方法
模拟退火算法
平台系统
任务分配策略
利润
决策树模型
规划系统
双层规划模型
数据映射关系
配置系统
大语言模型
知识图谱数据库
备课装置
构建知识图谱
预训练语言模型