摘要
本公开涉及大模型领域,尤其涉及信息提取与动态更新方法、系统、设备及介质。该方法包括:对企业网页中的多模态数据进行跨模态对齐,得到标准数据;将所述标准数据输入预设的微调大模型中,提取关键信息;用双编码器对所述关键信息进行编码得到语义特征向量,通过滑动窗口对所述语义特征向量进行上下文对比来判定更新边界;根据所述更新边界和预设的时间衰减权重判定更新信息,将所述更新信息映射为带时戳知识图谱。通过跨模态对齐得到标准数据,能够将不同模态的数据统一到同一语义框架下,消除数据间的语义鸿沟和格式差异。将标准数据输入预设的微调大模型提取关键信息,能够过滤掉无关的噪声信息,聚焦于对企业有价值的内容。
技术关键词
滑动窗口
动态更新方法
数据
跨模态
图谱
动态更新系统
适配器
语义框架
企业
双编码器
微调技术
电子设备
可读存储介质
判定算法
文本
格式
噪声信息