摘要
本发明公开了一种基于大模型和RAG技术的指代消解系统及方法,属于大模型数据处理领域,本发明基于分隔符置信度分级,动态切分文本块并保留上下文重叠,同时通过符号完整性校验避免成对标点断裂。这种机制既适应大模型的上下文窗口限制,又维护了文本块的语义连贯性,为后续指代消解提供高质量输入,结合文本相似性、结构相似性和语义相似性,并采用加权综合评分进行实体对齐判定。这种多维度融合策略克服了单一相似性计算的局限性,能够更全面地评估实体间关联性,通过RAG技术对上下文进行综合理解,结合大模型的推理能力,有效处理复杂语境下的歧义指代,确保实体关系的生成和知识融合更符合实际语义。
技术关键词
文本
实体
编码转换单元
指代消解方法
模块
处理单元
校验单元
编辑距离算法
字符
可读存储介质
数据
生成向量
格式
融合策略
语义向量
模式匹配
符号
分块
图谱
系统为您推荐了相关专利信息
电力负荷预测模型
电力负荷预测方法
数据
预测误差
时间序列预测模型
社区结构
动态网络社区
可视分析系统
动态网络分析
数据分析单元
关键词
预训练语言模型
计算机可读指令
主题
数据