基于检索增强生成的语言模型中文拼写检查方法及系统

正文

推荐专利

申请号：CN202410832719

申请日期：2024-06-26

公开号：CN118586384A

公开日期：2024-09-03

类型：发明专利

摘要

本发明属于自然语言处理技术领域，公开了一种基于检索增强生成的大型语言模型中文拼写检查方法及系统，选择使用大型语言模型来进行中文拼写检查任务；从向量数据库中获取相关的外部知识作为模型执行任务的辅助示例；为大型语言模型设计了合适的提示词，并采用使用少样本提示的方法，将RAG手段获得的辅助案例作为少样本放到大型语言模型的历史对话中，通过少样本提示得到的大型语言模型就是纠错大型语言模型；交给判别大型语言模型进行判断；构建对应的数据集来进行相应的性能评估，丰富中文拼写检查领域的数据集多样性。本发明为大型语言模型进行此类自然语言处理任务提供了鲜明的案例，为中文拼写检查任务提供了全新的评测思路。

技术关键词

大语言模型拼写检查方法纠错方法信息数据处理终端样本纠错系统语音文字识别自然语言光学字符识别计算机设备处理器搜索方法语义特征策略模块错误率可读存储介质

系统为您推荐了相关专利信息

基于大语言模型的博弈对抗智能体生成方法与系统

大语言模型策略生成方法无人机决策

一种基于大模型安全性的测试方法

样本空间模块测试方法模型测试技术策略更新

一种基于水下的多源数据特征融合方法

特征融合方法初始聚类中心海洋水声地质勘探数据物理海洋学

客户问题的回复方法、装置及电子设备

样本回复方法信息熵分词神经网络模型

一种多模态情绪分析系统及方法

多模态情绪情绪特征分析系统代表文本

基于检索增强生成的语言模型中文拼写检查方法及系统

站点导航

APP 下载