数据收集方法、装置、设备及介质

AITNT
正文
推荐专利
数据收集方法、装置、设备及介质
申请号:CN202411998966
申请日期:2024-12-30
公开号:CN119719465A
公开日期:2025-03-28
类型:发明专利
摘要
本发明公开了一种数据收集方法、装置、设备及介质,涉及计算机技术领域,应用于智能体,包括:利用少样本学习算法确定数据收集需求对应的目标主题领域和所需数据量;从种子词语管理器中确定与目标主题领域对应的初始种子词语列表,利用目标预训练模型对初始种子词语列表进行扩充;基于最少到最多提示算法鉴别扩充后种子词语列表中各目标种子词语的词性,利用与目标种子词语的词性对应的提示信息生成模板生成与目标种子词语对应的提示信息;基于提示信息并利用网络检索方式获取与所需数据量对应的目标数据集,其中,采用思维链条算法将当前步骤的输出作为下一步骤的输入。思维链条算法形成一个连贯的思维过程,并使得收集的数据可以保质保量。
技术关键词
数据收集方法 词语 种子 预训练模型 生成模板 主题 学习算法 链条 列表 管理器 数据收集装置 样本 可读存储介质 存储计算机程序 扩充模块 指令 网络
系统为您推荐了相关专利信息
1
一种基于成分组装的文本测试用例生成方法
蜕变关系 机器阅读理解 生成方法 语义 文本
2
基于大语言模型的决策算法测试方法、装置、设备及介质
测试场景 种子 大语言模型 生成提示词 决策算法
3
一种多模态实体对齐伪种子生成方法、介质、设备、产品
实体 种子生成方法 多模态 图谱 计算机可读指令
4
一种基于多知识库关联的人工智能问答方法
问答方法 知识点 预训练模型 人工智能问答系统 学生
5
一种实现智能推荐相关法条的方法及装置
算法模型训练 机器可读程序 训练集 政务服务技术 样本
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号