基于预训练语言模型和随机样本生成的检索问句条件分断系统

AITNT
正文
推荐专利
基于预训练语言模型和随机样本生成的检索问句条件分断系统
申请号:CN202411607838
申请日期:2024-11-12
公开号:CN119740574A
公开日期:2025-04-01
类型:发明专利
摘要
本发明的技术方案是公开了一种基于预训练语言模型和随机样本生成的检索问句条件分断系统,其特征在于,包括:标点修正模型;纠错数据对生成单元。本发明采取折中的策略,选取小体量的预训练过的文本编码器模型(如Bert、Roberta、Ernie)作为基座模型,通过标点标注间接解决子条件分断问题。同时,在本发明中,直接对输入的原始用户问句中的标点符号进行修正,避免了去标点化带来的信息损失。
技术关键词
预训练语言模型 分断系统 纠错 文本编码器 生成算法 数据 样本 基座 字符 策略
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号