基于预训练语言模型和随机样本生成的检索问句条件分断系统

正文

推荐专利

申请号：CN202411607838

申请日期：2024-11-12

公开号：CN119740574A

公开日期：2025-04-01

类型：发明专利

摘要

本发明的技术方案是公开了一种基于预训练语言模型和随机样本生成的检索问句条件分断系统，其特征在于，包括：标点修正模型；纠错数据对生成单元。本发明采取折中的策略，选取小体量的预训练过的文本编码器模型(如Bert、Roberta、Ernie)作为基座模型，通过标点标注间接解决子条件分断问题。同时，在本发明中，直接对输入的原始用户问句中的标点符号进行修正，避免了去标点化带来的信息损失。

技术关键词

预训练语言模型分断系统纠错文本编码器生成算法数据样本基座字符策略

基于预训练语言模型和随机样本生成的检索问句条件分断系统

站点导航

APP 下载