摘要
本发明公开了一种基于大模型和RAG技术的指代消解系统及方法,属于大模型数据处理领域,本发明基于分隔符置信度分级,动态切分文本块并保留上下文重叠,同时通过符号完整性校验避免成对标点断裂。这种机制既适应大模型的上下文窗口限制,又维护了文本块的语义连贯性,为后续指代消解提供高质量输入,结合文本相似性、结构相似性和语义相似性,并采用加权综合评分进行实体对齐判定。这种多维度融合策略克服了单一相似性计算的局限性,能够更全面地评估实体间关联性,通过RAG技术对上下文进行综合理解,结合大模型的推理能力,有效处理复杂语境下的歧义指代,确保实体关系的生成和知识融合更符合实际语义。
技术关键词
文本
实体
编码转换单元
指代消解方法
模块
处理单元
校验单元
编辑距离算法
字符
可读存储介质
数据
生成向量
格式
融合策略
语义向量
模式匹配
符号
分块
图谱
系统为您推荐了相关专利信息
彩色云图
地面气象观测数据
数值天气预报
光伏电站
地面气象站
碳化硅器件
检测模组
数字信号处理器
驱动芯片
桥臂
人机交互模块
指挥终端
资源分配
人机混合智能
数据