乐于分享
好东西不私藏

文献阅读系列|谁想用交通超级App?PLS-SEM与NCA联合分析的启示

文献阅读系列|谁想用交通超级App?PLS-SEM与NCA联合分析的启示

01
导语

顶刊文章读完,很多人的感受是:结论看懂了,但不知道他们怎么做到的。

这个系列就是干这件事——把分析过程拆开来,看清楚每一步在做什么、为什么这么做、换成你的研究能不能用。

今天拆的是发表在Transportation Research Part F(2025年)上的这篇:

Hasselwander, M. Who wants to use transport super apps? Insights from combined PLS-SEM and NCA methods.

研究问题本身不复杂:什么因素影响德国人使用交通超级App的意愿?

但分析框架值得细看——PLS-SEM + NCA双重分析,两套方法,两个维度,回答同一个研究问题里的两个不同问题。

先说清楚:他们要回答几个问题?

作者在引言里列了两个研究问题:

  • RQ1:哪些因素影响消费者的采纳意愿?

  • RQ2:哪些因素是必要条件?

这两个问题看起来相似,但逻辑上是不同的。

RQ1问的是”谁在推动结果”,RQ2问的是”谁是前提条件”。前者是充分性问题,后者是必要性问题。一套方法只能回答一个。这就是为什么要用两套方法——不是为了凑篇幅,是因为问题本身需要。

这是拆这篇文章最重要的第一步:搞清楚他们为什么要用两套方法,而不是一套

02

第一步:数据从哪来,怎么设计的

样本是575名德国智能手机用户,通过在线问卷收集,配额抽样(按性别、年龄、收入三个维度)。

有几个设计细节值得注意:

为什么是575而不是原始的1019? 

作者从1019份有效问卷里,筛选出”把交通服务列为超级App最重要功能之一”的受访者,最终得到575份。这个筛选逻辑很关键——研究的是交通超级App,而不是超级App本身,所以只保留对这个核心服务有明确偏好的人,样本更精准。

共同方法偏差怎么处理的? 

三个措施:匿名保证、预测变量和结果变量在问卷中时间上分开(不是紧挨着问)、事后跑Harman单因子检验。结果显示第一个公共因子只解释了40.6%的方差,低于50%的警戒线,说明共同方法偏差不是问题。

03

第二步:PLS-SEM怎么跑的

理论框架用的是UTAUT2,选了五个潜变量:

  • 绩效期望(PE)

  • 努力期望(EE)

  • 社会影响(SI)

  • 价格价值(PV)

  • 习惯(HA)

  • 外加性别、年龄、App疲劳三个控制变量

  • 因变量是行为意愿(BI)

测量模型先评估,结构模型再估计。

这个顺序不能反,很多人省了第一步直接看路径系数,是不规范的。

测量模型评估看了三件事:

  • 因子载荷是否都超过0.708(条目可靠性)——全部达标,只有一个HA的条目0.65不达标,直接删掉

  • AVE是否超过0.5(收敛效度)——全部达标

  • HTMT比率是否低于0.90(区分效度)——全部达标

测量模型没问题,才进入结构模型。

结构模型用的是Bootstrap10000次抽样来计算t值和置信区间,10000次是常见规范,比默认的5000次更精确。

路径系数结果:

三个假设被支持,两个被拒绝:

  • ✅ PE绩效期望:显著正向(β = 0.257)

  • ✅ PV价格价值:显著正向,且效应最强(β = 0.521)

  • ✅ HA习惯:显著正向(β = 0.199)

  • ❌ EE努力期望:不显著

  • ❌ SI社会影响:不显著

整体R²=0.78,解释力很强。

控制变量里,年龄越大,采纳意愿越强(β = 0.064)——这有点反直觉,但细想合理:老年人对打车、外卖等服务需求更大,年轻人反而更看重社交类超级App。

“App疲劳”显著正向影响采纳意愿(β = 0.112)——这也很有意思:越觉得手机App太多、越烦的人,反而更想用超级App来”一站式解决”。

04

第三步:NCA怎么接上去的

PLS-SEM跑完,作者直接提取了各潜变量的复合得分(composite scores),把这些得分作为NCA的输入。

这是两个方法衔接的关键操作:不是用原始量表题目跑NCA,而是用PLS-SEM算出来的潜变量得分。这样两套分析用的是同一套数据基础,结论才有可比性。

NCA用的方法是CR-FDH。简单说,它在散点图上画一条”天花板线”——这条线以上没有数据点,代表了在给定X水平下,Y的理论最大值。

效应量d就是天花板以下的空白面积占总面积的比例,d越大,必要性越强。

作者对每个潜变量都跑了NCA,看哪些的d值显著(only PE (d = 0.10; p < 0.01) and PV (d = 0.06; p < 0.01) exhibit significant effect sizes):

然后做了瓶颈分析——量化”要达到某个BI水平,各变量至少要到多少”

这个表直接告诉运营或产品:你想把用户采纳意愿拉到最高,绩效期望至少要拉到35.6%,价格感知至少要到12%。低于这个,其他一切努力都是在天花板以下打转。

05

第四步:两套结果放在一起怎么读

这是最终报告里最有价值的环节,也是很多人做了分析但没做到位的地方。

变量 PLS-SEM NCA 解读
PE 显著 必要条件(中效应) 平均效应存在,且是门槛变量
PV 显著 必要条件(小效应) 平均效应存在,且是门槛变量
HA 显著 非必要条件 平均效应存在,但不构成门槛
EE 不显著 非必要条件 两个维度都没有
SI 不显著 非必要条件 两个维度都没有

HA这一行是整篇文章最值得停下来想的地方。

习惯在PLS-SEM里显著——”越习惯用手机,采纳意愿越高”,这没问题。但NCA告诉你它不是门槛——即使一个人平时不怎么用App,只要产品够好、价格够合理,他照样可能用。

如果只看PLS-SEM,你可能会建议”重点培养用户的手机使用习惯”;但加上NCA,你会知道这不是优先项——真正的优先项是绩效期望和价格感知,因为这两个才是底线。

06

方法启发:什么时候值得加NCA?

这套组合在管理、营销、教育等领域都能用。如果你的研究问题包含以下任一:

  • “什么条件必须满足,用户才会……”

  • “哪些因素是不可或缺的前提”

  • “达到某个结果水平,最低需要多少X”

那NCA值得认真考虑。

需要注意的是,NCA不替代假设检验,是补充。先用PLS-SEM看路径系数和显著性,再用NCA看必要性——两套结论放在一起报,说的是不同维度的事,审稿人看到会觉得你想得很周全。

读这篇最大的收获,不是交通超级App的结论,是那张对比表给我的提醒:显著≠必要,不显著≠可有可无。

你手头的研究里,有没有哪个变量,你一直觉得它”肯定很重要”,但跑出来路径系数不显著——或者反过来,显著了但你怀疑它只是”锦上添花”?NCA或许能给你一个更清晰的答案。

关注我们,下期将继续为你带来更多前沿统计方法与软件实操解析,助你紧跟数据科学的脉搏!

-END-