基于预训练语言模型和随机样本生成的检索问句条件分断系统
站点导航
首页
AI资讯
AI技术研报
AI监管政策
AI产品测评
AI商业项目
AI产品热榜
AI专利库
AI需求对接
APP 下载
iOS 下载
安卓下载
# 热门搜索 #
大模型
人工智能
openai
融资
chatGPT
清空
确定
AITNT
正文
推荐专利
基于预训练语言模型和随机样本生成的检索问句条件分断系统
申请号:
CN202411607838
申请日期:
2024-11-12
公开号:
CN119740574A
公开日期:
2025-04-01
类型:
发明专利
摘要
本发明的技术方案是公开了一种基于预训练语言模型和随机样本生成的检索问句条件分断系统,其特征在于,包括:标点修正模型;纠错数据对生成单元。本发明采取折中的策略,选取小体量的预训练过的文本编码器模型(如Bert、Roberta、Ernie)作为基座模型,通过标点标注间接解决子条件分断问题。同时,在本发明中,直接对输入的原始用户问句中的标点符号进行修正,避免了去标点化带来的信息损失。
技术关键词
预训练语言模型
分断系统
纠错
文本编码器
生成算法
数据
样本
基座
字符
策略
沪ICP备2023015588号