摘要
本申请提供了生物数据实体标注方法、系统、电子设备及存储介质,该方法包括:a.获取待标注生物数据;b.基于所述待标注生物数据设计标注提示词;c.采用提示词拆解方法,对所述标注提示词进行拆分,获得多个子提示词;d.将所述待标注生物数据和第一子提示词输入至预训练大语言模型中,确定第一实体标注数据;e.循环步骤d,直至获得最后子提示词的实体标注数据;其中,所述提示词拆解方法选自思维链技术或分步提问法中的至少之一。该方法适于零标注生物数据集的实体标注,显著降低了专业壁垒,减少对领域专家知识的依赖,同时提高了标注的效率和准确性。此外,还减少对大规模标注数据的依赖,降低训练和标注成本,灵活适用于不同的生物医学领域。
技术关键词
实体标注方法
大语言模型
拆解方法
生物
文本
可读存储介质
标注系统
预训练模型
存储计算机程序
数据获取模块
电子设备
自然语言
存储器
处理器
手册
系统为您推荐了相关专利信息
表格解析方法
视觉检测算法
非结构化文档
光学字符识别技术
数据
动态口令卡
鉴别方法
密钥生成算法
访问系统
生物识别技术
关键词提取模型
特征数据库
匹配模块
中央控制模块
归一化模块