理论背景
概念
路径分析 是一种从多元回归扩展出来的统计方法,用于量化多个变量之间的直接与间接影响。本质是结构化的回归分析,核心价值在于拆解变量间的直接效应、间接效应与总效应,清晰呈现变量的因果传导路径。它不仅能告诉你哪个变量对结果有影响(像回归),还能分解这些影响的来源——是来自直接关系,还是通过其他变量间接传递。路径分析在心理学中常被视为揭示结构模型 SEM 的简化版本。在这里要与项目管理的关键路径区分,当然后面也有推文专门说这个。
普通回归只能得出自变量对因变量的 “总影响”,而路径分析可以拆分影响的传导路径。路径分析需要先基于理论构建路径模型(即变量间的因果关系框架),再通过数据验证模型是否成立。当变量间存在 “链式关联”“中介作用” 或 “多因一果” 时,路径分析能将这些关系整合到一个模型中,直观展示变量的层级结构,避免多次单独回归导致的逻辑混乱。
路径分析的目的
识别关键路径。通过路径系数的大小和显著性,判断哪些变量间的传导路径是核心,即关键路径。
分解效应占比。明确自变量对因变量的影响中,直接效应和间接效应各自的贡献比例,为决策提供精准依据。
简化复杂系统的因果关系。将多变量的复杂关联转化为可视化的路径图,让非专业人员也能理解变量间的作用逻辑。
路径分析的局限性:
路径模型的因果关系是基于理论或经验预设的,路径分析仅能验证该假设是否与数据拟合,无法直接推导因果关系。
路径模型的结构(哪些变量是自变量、中介变量、因变量)由研究者设定,不同的模型设定会得到完全不同的结果。若遗漏关键中介变量,会导致效应分解偏差;若路径方向设定错误(如将 “X→M” 设为 “M→X”),则结果完全失去意义。
路径回归要求变量满足多元线性回归的假设,即线性性假设、 无多重共线性假设、残差的独立性假设、残差的同方差性假设、 残差的正态性假设、自变量的非随机性假设。
传统路径分析只能处理可直接测量的显变量(如政策支持力度、供应链冗余度),无法直接纳入潜变量(如 “组织能力”“社会信任” 这类无法直接测量的变量)。若需分析潜变量,需使用结构方程模型(SEM)—— 路径分析是结构方程模型的 “特例”(无潜变量的 SEM)。
路径分析需要足够的样本量支撑,一般要求样本量为变量数的10~20 倍;若样本量过小,路径系数的估计结果不稳定,显著性检验易出现偏差。
路径分析的关键公式:
路径分析通常使用标准化数据计算路径系数(消除量纲影响,系数可直接比较大小),其公式为:
Excel实例分析
假设我们希望探讨学生的学习投入、学习时间、课堂行为及家庭支持如何通过直接和间接路径影响其学业成绩。这里的数据都是假设的,仅用来解释方法过程,并不反映真实情况。
变量含义定义如下:
| 变量 | 含义 | 单位 / 解释 |
|---|
| Y | 学业成绩(期末考试总分) | 分数(0–120) |
| X1 | 每周自主学习时间 | 小时 |
| X2 | 课堂学习投入指数 | 0–100 量表 |
| X3 | 课堂分心行为频次 | 次 / 周 |
| X4 | 家庭学习支持水平 | 0–100 量表 |
理论路径假设如下:
家庭支持(X4) 会影响:
学生的课堂学习投入(X2)
学生的课外自主学习时间(X1)
学习投入(X2) 会:
分心行为(X3) 会降低学业成绩(Y)
自主学习时间(X1) 会直接提高学业成绩(Y)
也就是说:
X4 → X2
X4 → X1
X2 → X3
X2 → Y
X1 → Y
X3 → Y
准备调研数据,数据内容如下:
接下来进行标准化处理,使用STANDARDIZE进行处理。
其使用方法如下所示:
其中均值使用AVERAGE,标准差使用STDEV.S公式。得到标准化后数据如下:接下来,计算直接效应,启用分析工具库(Analysis ToolPak)X1-X4的系数代表的是直接路径系数,就是标准化回归系数,在英文里面我们用的是partial regression coefficient,其中X1对Y的直接影响是0.607,X2对Y的影响是0.523,依次不再赘述。但是需要注意这里的P-value都没有低于0.05,也就是说显著性水平都没有达到要求,意味着没有足够的统计学证据拒绝原假设,即当前观察到的效应在统计上不显著。
接下来分析间接路径,要分析间接路径,首先需要有相关系数矩阵进行支撑。相关系数矩阵代表着总效应,可以用来验证核对路径分解是否正确。
选择数据的相关系数功能
接下来计算间接效应,依次执行下面的回归
为了简便,我们引入了Linest函数进行快速计算,=LINEST (因变量列,自变量矩阵,TRUE, TRUE),这个函数非常强大,希望大家能够熟悉掌握。通过回归方式,可以得到其系数结果如下:
接下来计算间接效应,可能的路径为:
X4 → X2 → Y,计算公式为X4-X2的回归系数,乘以X2到Y的回归系数。
X4 → X1 → Y,计算公式为X4 → X1的回归系数,乘以X1 → Y的回归系数。
X4 → X2 → X3 → Y,计算公式为X4 → X2的回归系数,乘以X2 → X3的回归系数,乘以 X3 → Y的回归系数。
详细计算过程如下:
家庭支持对成绩本身没有直接作用,但它通过提高学习投入、减少分心行为,间接提高了成绩。
最后是路径分析一致性检验
相关系数 ≈ 直接效应 + 所有间接效应
X4到Y的相关系数为-0.82,而X4到Y的直接路径系数为-0.160287416,我们将所有效应列出,即可实现相关系数 ≈ 直接效应 + 所有间接效应。
就这样,我们完成了一个标准的路径分析过程。
另外,我们也可以不考虑实际意义对数据上对其效应进行分析,仅从数理上论证这一过程,结果如下:
知识点分析
总结
今天我们系统分析了路径分析的理论过程,并用Excel对其过程进行了验证,请问你学会了吗?
相关推文
版权所有,商业转载请联系本人。
长按关注本公众号,

问卷调查,调研您关注或感兴趣的问题,方便请填写调查问卷(长按二维码识别):
