
01引言与目的
临床试验数据常面临人工统计误差的风险,而Excel作为数据汇总与展示的常用工具,通过合理运用其功能,能有效降低此类错误。Excel不仅适用于记录和筛选数据,更提供了单元格引用和公式等统计分析工具。这些工具可在临床试验数据表格内直接进行计算,从而对试验结果进行高效分析。接下来,我们将以二分类指标的临床试验数据为例,简要阐述如何利用Excel进行数据分析。
02数据转换
► 转换必要性
以申报试剂对临床诊断结果的灵敏度、特异度为例,我们探讨如何利用Excel进行临床试验数据分析。临床试验数据表通常包含受试者(样本)编号、年龄、性别、样本类型、临床诊断结果以及考核试剂的检测结果等多项数据列。临床诊断结果和考核试剂的检测结果通常以文本格式记录,但需要转换为“0/1”以进行有效的数学运算和条件判断。
► 转换实施步骤
为了便于后续的统计分析,我们首先需要对数据进行转换。在Excel中,临床诊断结果和考核试剂的检测结果,无论是以“确诊/排除”还是“+/-”的形式呈现,都是以文本格式进行记录的。然而,这种格式在进行条件判断时存在局限性,且无法进行数学运算。因此,推荐将这些数据转换为“0/1”的数字格式。接下来,我们以“临床诊断”数据的转换为示例进行详细说明。
通过数据筛选,我们可以观察到,“临床诊断”中主要使用“确诊”和“排除”两种方式进行表示。使用公式将“确诊”、“排除”与“+/-”分别转换为数字“1”和“0”,以确保数据分析的准确性。这样,我们就完成了对数据的初步转换工作。
在数据表格的右侧新增一列,命名为“临床诊断”转换,并在对应数据首行的单元格中输入以下公式:=IF(E2="确诊",1,0)。这里的E2单元格可以通过点击进行自动引用。
在Excel中,我们按照类似的方式,对考核试剂的检测结果也进行“0/1”转换。通过筛选功能,我们可以清晰地看到考核试剂的检测结果以“+/-”符号进行呈现。我们可以在诊断转换结果列的右侧再新增一列,命名为“考核试剂检测结果”转换。接着,在对应数据首行的单元格中输入公式“=IF(F2="+",1,0)”,这样就能将考核试剂的检测结果有效地转换为“0/1”形式。
完成首行数据的转换和判定后,我们继续将这个公式应用到其他数据行。
03四格表判定
► 四格表判定含义
在四格表中,我们使用a、b、c、d来分别代表四种不同的检测结果与临床诊断结果之间的关系。四格表为分析提供了清晰的结构,通过定义明确各个检测结果和诊断结果之间的关系。
► 判定实施步骤
依据四格表的定义,我们对经过转换的临床诊断结果与考核试剂的检测结果进行判定。在数据表格的右侧,我们新增了一列用于“四格表”的判定。在对应数据首行的单元格中,我们运用公式来表示上述的判定规则:
```
=IF(G2=1,IF(H2=1,"a","c"),IF(H2=1,"b","d"))
```
使用公式,将转换结果应用到四格表判定中,从而简化判定过程。输入“回车”后,该格子将显示出经过转换的四格表结果。
完成首行数据的转换和判定后,我们接下来需要选中包含公式的这三个单元格。随后,将鼠标指针移至最右侧单元格的右下角,当鼠标指针变为“+”号时,按住鼠标左键并向下拖拽,直至填充完所有有数据的数据行。这样,我们就完成了公式的填充,并展示了相应的判定结果。
04构建四格表
► 四格表构建步骤
接下来,我们需要在数据表的适当空白位置绘制一个四格表。这个四格表将用于呈现和分析数据,帮助我们更好地理解和利用数据。其中,G表示临床诊断结果,T代表考核试剂的检测结果。在数据表中创建四格表来汇总不同检测结果的数量,便于分析。
05数据统计
► 统计量计算
四格表最终呈现的数据,包括灵敏度、特异度、总符合率,以及这三个指标的95%置信区间,共同构成了评估结果的全貌。通过公式计算灵敏度、特异度等统计量,并确保它们以百分比形式展示。
以灵敏度为例,它表示的是临床诊断为“确诊”的受试者中,考核试剂检测结果为“阳性”的比例。因此,在灵敏度点估计的格子中,我们填写了公式:“=K3/K5”。
► 置信区间计算
置信区间的计算涉及多种方法,针对二分类数据,目前常采用二项分布近似正态的方法进行计算。然而,在极端情况下,这种方法可能不够保守。因此,推荐采用威尔逊置信区间计算方法,尽管其公式较为复杂,但可以在文章末尾提供的附件表格中查阅。使用二项分布近似正态或威尔逊置信区间等方法,计算适用于二分类数据的置信区间。
06使用注意事项
在利用Excel进行上述统计分析时,务必细心处理原始数据,确保数据表示的一致性和去除原始数据中的不可见空格,以保证分析的准确性。当整合多个中心的数据时,可以通过手动替换的方式保证“0/1”转换的准确性。此外,还需留意原始试验结果单元格中可能存在的不可见空格,它们会影响“0/1”结果的转换,因此应当予以去除。
近20年来,数据处理的方法和技术不断涌现,酷炫的模型和实用的软件不胜枚举。然而在长期的管理实践和培训工作中,我们发现不少生搬硬套复杂工具方法却产生解释偏误的情形。这提示我们,便捷实用才是最方便的也是管理者最需要的。今天给大家推荐一本好书——《医院管理与医学研究的EXCEL数据建模》。实践证明,只要数据质量有保证,绝大多数管理工作所需要的数据支持,通过简单的统计便可以满足。正因如此,这本书选择了以每一位管理者都会接触到的Excel软件作为起点和复杂分析的延伸链接点,进行数据处理方法的介绍。本书由北京大学公共卫生学院副教授、国家卫健委医政医管局 DRG 质控中心专家为主导,联手几十位全国各地三甲医院在职医师倾情打造,具有超强实用性和前瞻视角的专业性。精选十余年医院管理数据建模的实践案例,层层梳理,通过还原以EXCEL为代表的电子表格软件在医院的真实应用场景,帮助决策者做出正确的管理决定。书中涉及数学原理的解释时,我们尽量做到简明扼要;在操作方法的介绍时,我们尽量详细;在应用场景选择上,我们尽量还原医院的真实场景。本书多个章节的呈现方式均是“带着管理问题寻找数据、根据数据形态选择方法、立足分析结果总结证据”的过程。
本书2025年6月第1版首次公开发行,结合当下医院改革背景和卫健委最新政策,结合当下医院最新案例分析,用最热门的数据分析方式帮医院抓住发展“现金流”,值得推荐给全国所有二级以上医院学习,提升管理水平,抓住下一个黄金窗口。