欢迎访问文稿网!

主成分分析的计算步骤

范文之家 分享 时间: 加入收藏 我要投稿 点赞

主成分分析的计算步骤

    设有n个样本,每个样本观测指标(即变量):X1,X2,…,Xp构成原始数据矩阵:

    则主成分分析的主要计算步骤如下:

    步骤1:将逆指标(越小越好的指标)变换为正指标(越大越好的指标),通常取负或取其倒数。

    步骤2:原始数据标准化,消除由于数据量纲不同带来的不利分析的影响。 变量标准化公式为:

    其中,xj和 var(xj)分别表示第j个变量的均值和标准差。

    为方便记,假定原始数据经过标准化后仍然用X表示,那么,X=(x1,x2,…,xp)′的p个变量综合成p个新变量;新的综合变量可以由原来的变量x1,x2,…,xp线性表示。即:

    并且满足

    步骤3:建立数据阵X的相关系数矩阵:R=(rijp*p

    步骤4:求R的特征根λ1≥λ2≥…≥λp≥0及对应的特征向量ei(i=1,2,…,p)。

    步骤5:计算累计贡献率Mk,并根据累计贡献率Mk的大小来确定主成分的个数。一般的,当Mk≥85%时,取前k个主成分来代替原来的p个指标变量的信息。其中,第i个主成分的表达式为:

    Fi=a1iX1+a2iX2+…+apiXp,i=1,2,…,k (4.4.9)

    步骤6:计算主成分负荷:

    由此,可以进一步计算得到主成分得分:

221381
领取福利

微信扫码领取福利

微信扫码分享