摘要:目的 探讨基于随机森林算法构建胆囊疾病预测模型的可行性,识别具有判别力的关键临床指标。方法 回顾 性收集2021年10月至2024年10月于达拉特旗人民医院确诊的胆囊疾病患者1693例作为疾病组,同期健康体检者3 612例作为对照组。收集胆固醇、甘油三酯、高密度脂蛋白胆固醇、体重指数、体重、低密度脂蛋白胆固醇、尿酸、身高、空 腹血糖、年龄共10项指标。采用随机森林算法构建分类模型,通过特征重要性排序识别关键预测因子,通过10折交叉 验证和敏感性分析验证模型稳定性。结果 随机森林模型在测试集上曲线下面积(AUC)为0.765(95%CI :0.753~ 0.776),灵敏度为0.799,特异度为0.593,平衡准确度为0.696。变量重要性分析显示,胆固醇、甘油三酯、体重指数、年 龄和高密度脂蛋白胆固醇为前五位关键预测指标。结论 本研究构建的随机森林模型具有良好的判别能力,揭示血脂 代谢与肥胖相关指标在胆囊疾病发生中的重要作用,为早期筛查与风险干预提供了数据支持。