摘要
本发明公开了一种基于TCR测序的肺癌早筛模型的构建方法,首先基于来源于肺癌患者和健康人样本的TCR测序数据构建富集TCR序列数据库,然后对每个样本进行TCR测序并获取每个样本的TCR特征,包括V gene和J gene的占比特征、TCR免疫组库的统计特征、趋同序列特征、TCR序列氨基酸占比特征、不同长度TCR序列占比特征、不同频率TCR序列占比特征和TCR富集序列特征;利用特征筛选方法对每个样本的TCR特征进行筛选后,结合样本的其他信息构建机器学习模型,得到肺癌早筛模型;并基于所述肺癌早筛模型构建了肺癌早筛检测装置,能够基于样本的TCR测序信息实现肺癌早筛。
技术关键词
样本
序列特征
肺癌
特征筛选方法
富集
TCR免疫组库
统计特征
构建机器学习模型
分析模块
数据
输出模块
频率
指数
训练集
血液
校正