摘要目的探索结节病的关键基因,并为其分子机制提供理论依据。方法实验性研究。从基因芯片公共数据库(GEO)中下载获得结节病患者外周血的基因芯片数据集GSE34608和GSE18781。使用R软件对芯片数据进行整合并筛选出差异基因。随后进行基因本体论(GO)富集分析和KEGG信号通路分析,利用随机森林和LASSO回归两种算法,筛选出核心基因。为进一步验证基因芯片的结果,选取成都医学院第一附属医院2017年7月至2020年10月收治的肺结节病患者50例设为病例组,并选取于同一时期体检的50例健康志愿者设为健康对照组。采用酶联免疫吸附法对生信分析结果进行验证。结果761个差异基因在免疫反应、炎症反应、GTP酶的活性等生物学过程和功能中均有富集。且富集于T细胞受体,NF-κB,AMPK等信号通路。随机森林和LASSO回归两种算法筛选出核心基因为SPOCK2,ELISA结果显示0~Ⅰ期肺结节病患者(3.24±0.18)μg/L及Ⅱ~Ⅲ期肺结节病患者(5.03±0.12)μg/L,外周血样本中的SPOCK2浓度低于健康对照组(9.31±0.59) μg/L,且差异有统计学意义(F=37.36,P<0.05),且血清SPOCK2对0~Ⅰ期肺结节有较高的诊断效能(AUC=0.836)。结论筛选的核心基因SPOCK2为结节病的发病机制和靶向治疗提供了理论基础,同时通过实验验证血清SPOCK2对于肺结节病的诊断有一定帮助。