摘要
本发明提供一种基于大模型的汉字输入系统自动预测方法及装置,涉及自然语音技术领域,该方法包括:获取拼音序列对应的多个候选汉字序列;将多个候选汉字序列和拼音序列输入到大模型中,对多个候选汉字序列进行重新排序和/或筛选,得到最终的多个候选汉字序列;其中,大模型是基于包括拼音‑汉字对的训练数据集进行预训练,并基于直接偏好优化算法进行微调得到的。本发明实现提高候选汉字序列的整体质量,从而提高汉字输入系统的汉字预测准确性。
技术关键词
汉字输入系统
自动预测方法
序列
正确汉字
中文文本
非暂态计算机可读存储介质
模糊拼音
词频库
处理器
自然语音
计算机程序产品
预测装置
词语
数据
算法
语义
存储器
电子设备
系统为您推荐了相关专利信息
异常检测方法
矩阵
数据
无监督学习
集成学习方法
分布式无人机基站
分布式多智能体
信号覆盖方法
深度强化学习算法
网络结构
数据集构建方法
动态
依存句法分析
自然语言文本
模型训练方法