摘要
本申请涉及一种生成式语言模型辅助的扎根理论编码优化方法,包括步骤:接收原始文本数据,通过转录和分句工具将所述原始文本数据转换为分句后的初始语料集;利用预训练的生成式语言模型对所述初始语料集进行语义分析,提取文本特征,生成特征向量集合;基于所述特征向量集合,将所述新文本自动归类至对应的三级编码类别;对所述自动分类结果进行人工审核,对低匹配度或存在歧义的编码项进行修正,并将修正结果反馈至所述生成式语言模型以优化模型参数;动态更新编码语料库及文本特征集,实现模型的持续优化。本申请具有提升质性研究中的编码效率、准确性和一致性的效果。
技术关键词
编码优化方法
文本
生成特征向量
动态更新
语义
理论
增量学习算法
依存句法分析
数据
可读存储介质
特征提取模块
处理器
注意力机制
聚类算法
计算机设备
关键词
存储器