首页 > 资讯 > > 内容页

惊艳!小白也能画出精美的ROC曲线,速来一试(附全套代码)

发表于: 2023-08-01 17:09:33 来源:哔哩哔哩

本文主要以一篇基于logistic回归构建预测模型的文章为例,分别用R语言和风暴统计免费在线平台对预测模型验证过程中经常用到的ROC曲线绘制和AUC曲线下面积计算进行复现。


(资料图片仅供参考)

今日文章分为三部分

1. 文章解读

2. R语言复现

3. 小白美化ROC曲线的方法

文章解读

案例文献是一篇基于SEER公共数据库的一项回顾性研究,旨在开发和验证列线图以预测脑转移的非小细胞肺癌患者早期死亡。

一、摘要

背景:在非小细胞肺癌(NSCLC)的整个病程中,很多患者会出现预后差、死亡率高的脑转移(BM)。然而,很少有模型能预测有脑转移的NSCLC患者的早期死亡(ED)。我们旨在开发列线图来预测NSCLC脑转移患者ED。

方法:从监测、流行病学和最终结果(SEER)数据库中选取了2010年至2015年间患有BM的NSCLC患者。纳入标准如下:(I)患者经病理诊断为NSCLC;(II)患者患有BM。患者按7:3的比例随机分为两组,分别为训练组和验证组。采用单因素和多因素Logistic回归方法来确定伴有BM的NSCLC患者发生ED的危险因素。建立了两个列线图,并通过校准曲线、ROC曲线和决策曲线分析(DCA)进行了验证。随访数据包括生存月数、死因和生命状态。初次诊断后3个月内的死亡定义为ED,终点为全因ED和癌症特异性ED。

结果:共纳入了4,920名患有BM的NSCLC患者,并随机分为两个队列(7:3),包括训练队列(n=3,444)和验证队列(n=1,476)。全因ED和癌症特异性ED的独立预后因素包括年龄、性别、种族、肿瘤大小、组织学、T分期、N分期、分级、手术、放疗、化疗、骨转移和肝转移。所有这些变量都用于建立列线图。在全因ED和癌症特异性ED的列线图中,训练数据集的ROC曲线下面积分别为(95% CI:)和(95% CI:),验证数据集的ROC曲线下面积分别为(95% CI:)和(95% CI:)。此外,校准曲线证明预测的ED与实际值一致。DCA临床应用前景良好。

结论:列线图可用来预测患者死亡的具体概率,有助于治疗决策和重点护理,以及医患沟通。本文构建logistic预测模型并做内部验证,思路框架清晰,案例十分典型。先拆分数据集为训练集和验证集,比例为7:3,验证集用于进行内部验证。然后做基线描述,比较训练集和验证集的基线差异性,再做单因素和多因素logistic回归,将单因素P值小于的因素纳入到多因素回归模型中。再根据多因素回归的结果构建列线图预测模型,并对模型进行验证,绘制ROC、校准曲线及DCA曲线,模型比较稳定。

今天我们对本文的ROC曲线绘制展开复现。研究者以非小细胞癌脑转移患者全因早死和癌症特异性早死为因变量,下表是本文所研究的影响因素基线情况。

二、研究结果

1.列线图预测模型的建立

利用训练队列中多元逻辑回归的预后因素,建立了列线图预测模型。总分可以通过将每个变量的分数相加来计算,表明每个患者的ED的全因/癌症特异性概率。

2.列线图预测模型的验证

对于全因和癌症特异性ED的列线图模型,ROC曲线显示,训练队列中的AUC分别为(95%CI:)和(95%CI:),验证队列中的AUC分别为(95%CI:)和(95%CI:)。

R语言复现

根据文章的纳排标准,从SEER数据库提取数据,并通过筛选、整理得到数据集total,将数据按照7:3拆分为训练集train和验证集test,并展开分析。本文重点复现文章中训练集ROC曲线的绘制。1、安装和加载R包,导入train数据集,共14个自变量,均为定性数据。经过单因素及多因素logistic回归,包括年龄、性别、种族、肿瘤大小、组织学、T分期、N分期、手术、放疗、化疗、骨转移、肝转移均纳入构建预测模型。

2.添加新变量,计算训练集预测概率。

代码解读:

train_model1:是从glm继承的模型对象,即通过多因素Logistic回归构建的模型;newdata:选定数据框;

type: 表示预测种类。默认是归一化的线性预测; responses是归一化的响应变量。因此对于一个二分类模型,默认是log-odds (logit归一化的概率),然而type="response"给出的是预测概率。"erms"返回一个矩阵提供在线性预测下模型公式中每一项的拟合值。

3.计算AUC去线下面积

详情请点击下方:

/s?__biz=MzAwOTYyMDY3OQ==&mid=2650407323&idx=1&sn=5b53749db722a62642aec53a97e1714a&chksm=83527c33b425f525f4f95f6c843915a7b4850595bf9258a170455b31e3ff6e5baf0d8a4f97e5&token=1814709572&lang=zh_CN#rd

标签:

Copyright ©  2015-2022 今日上海网版权所有  备案号:京ICP备2022022245号-14   联系邮箱:435 226 40@qq.com