基于合成位置编码的长文本生成对齐方法及系统

AITNT
正文
推荐专利
基于合成位置编码的长文本生成对齐方法及系统
申请号:CN202411543862
申请日期:2024-10-31
公开号:CN119493869A
公开日期:2025-02-21
类型:发明专利
摘要
本公开提供了基于合成位置编码的长文本生成对齐方法及系统,涉及自然语言处理及文本处理技术领域,包括:获取对话式文档数据,将取对话式文档数据拆分为连续的指令‑响应对序列;通过位置索引对指令‑响应对序列中词元的位置信息进行编码;对指令‑响应对序列的语义依赖的相对距离进行扩展,重新分配位置索引将原始位置进行扩展,通过使用一个指示函数确定是否符合添加跳过步骤的条件,并确定何时设置引入跳过的步骤;引入跳过步骤,有选择地将跳过距离应用于位置索引中的特定结构,对指令‑响应对序列的上下文语义依赖关系进行扩展;将扩展之后的位置索引输入至基于LLaMA‑2的对齐模型中,实现长文本的对齐合成。
技术关键词
对齐方法 索引 非暂态计算机可读存储介质 指令 序列 语义 文本处理技术 对齐系统 电子设备 处理器 偏差 存储器 数据获取模块 对齐模块 计算机程序产品 编码模块 自然语言
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号