摘要
本发明属于自然语言处理技术领域,公开了一种基于检索增强生成的大型语言模型中文拼写检查方法及系统,选择使用大型语言模型来进行中文拼写检查任务;从向量数据库中获取相关的外部知识作为模型执行任务的辅助示例;为大型语言模型设计了合适的提示词,并采用使用少样本提示的方法,将RAG手段获得的辅助案例作为少样本放到大型语言模型的历史对话中,通过少样本提示得到的大型语言模型就是纠错大型语言模型;交给判别大型语言模型进行判断;构建对应的数据集来进行相应的性能评估,丰富中文拼写检查领域的数据集多样性。本发明为大型语言模型进行此类自然语言处理任务提供了鲜明的案例,为中文拼写检查任务提供了全新的评测思路。
技术关键词
大语言模型
拼写检查方法
纠错方法
信息数据处理终端
样本
纠错系统
语音文字识别
自然语言
光学字符识别
计算机设备
处理器
搜索方法
语义特征
策略
模块
错误率
可读存储介质
系统为您推荐了相关专利信息
特征融合方法
初始聚类中心
海洋水声
地质勘探数据
物理海洋学