摘要:目的 探讨基于随机森林算法构建胆囊疾病预测模型的可行性,识别具有判别力的关键临床指标。方法 回顾性纳入2021年10月至2024年10月于达拉特旗人民医院确诊的胆囊疾病患者1693例作为疾病组,同期健康体检者3612例作为对照组。收集胆固醇、甘油三酯、高密度脂蛋白胆固醇、体重指数、体重、低密度脂蛋白胆固醇、尿酸、身高、空腹葡萄糖共9项指标。采用随机森林算法构建分类模型,通过特征重要性排序识别关键预测因子,并评估模型性能。结果 随机森林模型在测试集上曲线下面积(AUC)为0.72,灵敏度为0.966,特异度为0.541。变量重要性分析显示,胆固醇、甘油三酯、体重指数、高密度脂蛋白胆固醇和体重为前五位关键预测指标。结论 本研究构建的随机森林模型具有良好的判别能力,揭示血脂代谢与肥胖相关指标在胆囊疾病发生中的重要作用,为早期筛查与风险干预提供了数据支持。