摘要
本发明涉及人工智能与数据挖掘交叉技术领域,具体提供了一种结构化信息智能采集与处理方法及装置,首先,进行名词定义,包括动态键值的生成、冲突消解引擎、多模态适配器和构建私有大语言模型;分析处理过程,在输入层通过多模态适配器对图像、音视频信息进行识别,提取其中的文字信息,形成原始文本;在处理层利用私有大语言模型引擎,对输入层的原始文本进行结构化提取,再按照设定的规则格式进行转换输出;在优化层,利用私有大模型实现质量校验,包括去重、冲突消解、智能摘要、数据落地和存储字段。与现有技术相比,本发明能够大大提升基础数据采集的效率。
技术关键词
大语言模型
机器可读程序
数据挖掘交叉技术
文本
适配器
多模态
键值
摘要
格式
动态
音视频
嵌套结构
字段
语义
图像
语音
存储器
处理器
拼音
系统为您推荐了相关专利信息
古建筑信息
展示系统
三维模型构件
生成三维模型
数据获取单元
互联互通控制系统
传输路径
生成控制指令
冗余
场景
语义向量
光学字符识别技术
文本
数据获取模块
长短期记忆网络