内容

首页 > > 内容
  • 判别分析

    来源:默认管理员点击数:329发布时间:2012-12-10

      1 基本概念:判别分析(Discriminant Analysis)是根据观测到的某些指标对所研究的对象进行分类的一种统计方法。进行判别分析时,通常是根据已掌握的一批分类明确的样品建立判别函数、分类的规则,然后将待分类的样品的实测值代入该函数,求出其函数值,并据此作出判断。按数学原理,判别分析分概率型、非概率型两类方法。常用的判别分析方法主要包括:Bayes准则下的判别分析、Fisher准则下的判别分析。

      2 基本原理

      Bayes准则:设有g个分类明确的总体π1,π2,πg,分别为x1,x2,…,xp 的多元正态分布。对于任何一个个体,若已知p个变量的观察值,要求判断该个体最可能属于哪一个总体。在某一分类规则下,我们把实属第i类的个体错分到第j类的概率记为P(j|i),这种错分造成的损失记为C(j|i)。那么,在这个判别分类规则下,实属第i类个体错分到其他类别的总损失为

      记第i类个体出现的概率为P(π1),从而这个判别分类规则错分的平均损失为

      Bayes判别准则是:平均损失最小化。按照这一准则寻找判别分类的方法,称为Bayes判别分析。

      Fisher准则:

      对两类判别,对任意一组常数(a1,a2,…an),构造线性函数,

      Z=a1X1+a2X2+…+anXn

      在条件 

      最大的原则下,获得判别函数。

      其中, 为两组的Z得分, 为两组Z得分方差的联合估计。

      对多类判别,寻找满足矩阵方程

      [B-λW]A=0

      的系数矩阵。其中B为类别间的方差-协方差矩阵,W为类别内的方差-协方差矩阵。

      判别分析应用示例

      在一项市场细分研究中,经过研究(如:聚类分析等),将被访者分为3类,Bayes准则下的判别函数为:

      P1= -3.5+0.52 age+12.5vision+3.3at+0.036bv+0.564qpv

      P2= -1.5+0.65 age+10.3vision+3.8at+0.022bv+0.415qpv

      P3= -8.5+0.85 age+13.5vision+1.3at+0.006bv+0.612qpv

      Fisher准则下的判别函数为:

      D1= -2.5+0.12 age+6.5vision+2.3at+0.12bv+0.35qpv

      D2= -4.4+0.25 age+5.3vision+3.5at+0.05bv+0.65qpv

      相应的Territorial Map图为:

    上一篇下一篇
ص