-
第8章 区别分析
多变量分析:管理上的应用林师模、陈苑钦
区别分析原理
优、劣公司之财务绩效表现如下图,先计算两组样本的平均数,再以两组平均数的中点为分界,可以将样本分为两组
选择区别变数(1)
以EBIT及ROE为两轴,绘出各个资料点在座标平面上所在的位置,而Z轴则为与EBIT轴夹角θ的新轴图中样本点P投影至Z轴之投影长度为ZP,其计算的公式为,其中,w1、w2可视为在两个变数的线性组合中的权重
选择区别变数(2)
图8-3中,有4个财务比率变数X1、X2、X3、X4,我们由两个群组中抽样,图中的曲线为各组样本在个别变数的分配.由其中可以看出,变数X1和X2区别两组样本的效果,优於变数X3和X4
界定区别规则
组间均方误(SSB)对组内均方误(SSW)的比值λ会随著夹角θ而变动,当λ值愈大,表示其对应的Z轴上,各投影点的组间均方误和组内均方误的差异愈大,也就是该轴线区别各组的能力愈佳.因此,决定区别方程式的基本原则,就是「找出极大化λ值的夹角θ」
常用的区别规则
主成份分析 vs. 区别分析
主成份分析和区别分析都是要找出一个最适的、所有变数的线性组合,但是,它们选择最适线性组合的标准并不相同主成份分析的目的是要找出能够涵盖最大变异的线性组合,来削减变数个数,因此其选择的标准为能够「极大化SST」的方程式区别分析的目的则是在找出一个最能够区别出各群组的线性组合
分类(1)
在区别分析中往往必须同时考虑成本和机率,以决定最适合的区别规则,设如果x是来自Π1,则U的分配为N(0.5δ,δ);如果x是来自Π2,则U的分配为N(-0.5δ,δ),其中当两分群的误判成本相同时,我们可以把x来自两个不同母体的情况下,U的分配绘成下图P(1∣2)为x属於母体2的情况下,将x误判为来自母体1的机率P(2∣1) 则为x属於母体1之下,将x误判为来自母体2的机率
分类(2)
当两群组的误判成本不相等时,我们可以藉著调整区别规则来改变误判的机率,但当其中一群组的误判率下降时,必定会造成另一群组的误判率提高将区别规则改为「若U>u,则判定为Π1」,其中,u为一非0之实数常数如果我们希望将P(1∣2),即误判群体2之样本为群体1的机率,控制在α以下,则依据Π2的分配,可以将临界值设为
区别规则(1)
一般化的区别规则应该是将误判的成本函数及先验机率同时纳入考虑,以获得能够极小化总误判成本的区别规则基本假设假设各群体的机率密度函数已知,群体Π1的机率密度函数为f1 (x; θ1),群体Π2的机率密度函数为f2 (x; θ2),则选定的区别规则应该能够把p维(p个区别变数)的样本空间切割为R1与R2.当x落在R1,将之判定为Π1;落在R2,则判定为Π2令C(ij)表示将某一属於Πj的样本误判为Πi的成本,而P(ij)表示上述情况发生的机率
区别规则(2)
区别规则的产生各群体之变异-共变异矩阵相等极小化对随机样本误判成本的方法为「贝氏法则」(Bayes rule)如果两群体发生的先验机率相等(p1= p2=0.5)贝氏法则可表示为在两群体误判成本相等,且变异-共变异矩阵相等的情况下,我们可以将第i个群体之「区别函数」(classification function)定义为将样本值(x)代入各群之区别函数计算其值,并以区别函数值最大之那一群做为该样本归属的群体
区别规则(3)
区别规则的产生各群体之变异-共变异矩阵不等贝氏法则可表示如下在两群体误判成本相等的情况下
区别规则(4)
错误分类成本不同之情况我们可以利用对先验机率的设定,来进行误判成本不同之下的区别分析,令在 的情况下,若且唯若 使得进行误判成本不相等的分析情况,我们可以将两群体的先验机率设为p1*及p2*,再以电脑软体进行区别分析
区别规则(5)
多於两群体之分析计算观测样本和各群体平均数之间的马氏距离,将观测样本归到最接近的群体计算观测样本归属於各群体的事后机率,并将观测样本归到事后机率最大的群体计算各群体的区别函数值,并将观测样本归到区别函数值最大的群体
变数选择程序
向前选择程序向前选择程序主要是希望依序在所有变数之中,找出区别效果最佳的变数向后消去程序向后消去程序是先将所有变数视为可能的区别变数,而后对每一个变数以其余所有变数为共变异数,进行ANCOVA,若有部份变数的F值未达显著水准,则选择其中F值最小者,将之排除逐步选择程序首先如同向前选择法,藉由ANOVA选择F值最大者为区别变数;其次,在每加入一个新的变数时,再进行ANCOVA,并检视所有已被选取的区别变数,如果有F值未达显著水准的变数,就将其中F值最小的变数剔除
统计检定
评估区别变数的显著性Wilk's Λ检定:当Λ的值愈小时,表示该变数各组平均数差异愈大,而该变数即为良好的区别变数F统计量评估区别函数的显著性评估区别效果由观察值正确被分组的比率来衡量以区别函数的特徵值(eigenvalue,为典型相关系数的平方)为指标,特徵值为组间变异与总变异之比,当特徵值愈大时,表示该区别函数愈有效
卡方检定统计量
第8章 区别分析
多变量分析:管理上的应用林师模、陈苑钦
区别分析原理
优、劣公司之财务绩效表现如下图,先计算两组样本的平均数,再以两组平均数的中点为分界,可以将样本分为两组
选择区别变数(1)
以EBIT及ROE为两轴,绘出各个资料点在座标平面上所在的位置,而Z轴则为与EBIT轴夹角θ的新轴图中样本点P投影至Z轴之投影长度为ZP,其计算的公式为,其中,w1、w2可视为在两个变数的线性组合中的权重
选择区别变数(2)
图8-3中,有4个财务比率变数X1、X2、X3、X4,我们由两个群组中抽样,图中的曲线为各组样本在个别变数的分配.由其中可以看出,变数X1和X2区别两组样本的效果,优於变数X3和X4
界定区别规则
组间均方误(SSB)对组内均方误(SSW)的比值λ会随著夹角θ而变动,当λ值愈大,表示其对应的Z轴上,各投影点的组间均方误和组内均方误的差异愈大,也就是该轴线区别各组的能力愈佳.因此,决定区别方程式的基本原则,就是「找出极大化λ值的夹角θ」
常用的区别规则
主成份分析 vs. 区别分析
主成份分析和区别分析都是要找出一个最适的、所有变数的线性组合,但是,它们选择最适线性组合的标准并不相同主成份分析的目的是要找出能够涵盖最大变异的线性组合,来削减变数个数,因此其选择的标准为能够「极大化SST」的方程式区别分析的目的则是在找出一个最能够区别出各群组的线性组合
分类(1)
在区别分析中往往必须同时考虑成本和机率,以决定最适合的区别规则,设如果x是来自Π1,则U的分配为N(0.5δ,δ);如果x是来自Π2,则U的分配为N(-0.5δ,δ),其中当两分群的误判成本相同时,我们可以把x来自两个不同母体的情况下,U的分配绘成下图P(1∣2)为x属於母体2的情况下,将x误判为来自母体1的机率P(2∣1) 则为x属於母体1之下,将x误判为来自母体2的机率
分类(2)
当两群组的误判成本不相等时,我们可以藉著调整区别规则来改变误判的机率,但当其中一群组的误判率下降时,必定会造成另一群组的误判率提高将区别规则改为「若U>u,则判定为Π1」,其中,u为一非0之实数常数如果我们希望将P(1∣2),即误判群体2之样本为群体1的机率,控制在α以下,则依据Π2的分配,可以将临界值设为
区别规则(1)
一般化的区别规则应该是将误判的成本函数及先验机率同时纳入考虑,以获得能够极小化总误判成本的区别规则基本假设假设各群体的机率密度函数已知,群体Π1的机率密度函数为f1 (x; θ1),群体Π2的机率密度函数为f2 (x; θ2),则选定的区别规则应该能够把p维(p个区别变数)的样本空间切割为R1与R2.当x落在R1,将之判定为Π1;落在R2,则判定为Π2令C(ij)表示将某一属於Πj的样本误判为Πi的成本,而P(ij)表示上述情况发生的机率
区别规则(2)
区别规则的产生各群体之变异-共变异矩阵相等极小化对随机样本误判成本的方法为「贝氏法则」(Bayes rule)如果两群体发生的先验机率相等(p1= p2=0.5)贝氏法则可表示为在两群体误判成本相等,且变异-共变异矩阵相等的情况下,我们可以将第i个群体之「区别函数」(classification function)定义为将样本值(x)代入各群之区别函数计算其值,并以区别函数值最大之那一群做为该样本归属的群体
区别规则(3)
区别规则的产生各群体之变异-共变异矩阵不等贝氏法则可表示如下在两群体误判成本相等的情况下
区别规则(4)
错误分类成本不同之情况我们可以利用对先验机率的设定,来进行误判成本不同之下的区别分析,令在 的情况下,若且唯若 使得进行误判成本不相等的分析情况,我们可以将两群体的先验机率设为p1*及p2*,再以电脑软体进行区别分析
区别规则(5)
多於两群体之分析计算观测样本和各群体平均数之间的马氏距离,将观测样本归到最接近的群体计算观测样本归属於各群体的事后机率,并将观测样本归到事后机率最大的群体计算各群体的区别函数值,并将观测样本归到区别函数值最大的群体
变数选择程序
向前选择程序向前选择程序主要是希望依序在所有变数之中,找出区别效果最佳的变数向后消去程序向后消去程序是先将所有变数视为可能的区别变数,而后对每一个变数以其余所有变数为共变异数,进行ANCOVA,若有部份变数的F值未达显著水准,则选择其中F值最小者,将之排除逐步选择程序首先如同向前选择法,藉由ANOVA选择F值最大者为区别变数;其次,在每加入一个新的变数时,再进行ANCOVA,并检视所有已被选取的区别变数,如果有F值未达显著水准的变数,就将其中F值最小的变数剔除
统计检定
评估区别变数的显著性Wilk's Λ检定:当Λ的值愈小时,表示该变数各组平均数差异愈大,而该变数即为良好的区别变数F统计量评估区别函数的显著性评估区别效果由观察值正确被分组的比率来衡量以区别函数的特徵值(eigenvalue,为典型相关系数的平方)为指标,特徵值为组间变异与总变异之比,当特徵值愈大时,表示该区别函数愈有效
卡方检定统计量
…… 欲阅读全文,请下载!
- 立即下载:注意:请一定升级到最新版[OFFICE]才能正常打开本站提供的文档![常见问题指南]
- 相关搜索:
- →GOOGLE中搜索"区别分析"相关网站.
- →BAIDU中搜索"区别分析"相关网站.
- →YAHOO中搜索"区别分析"相关网站.
- →LIVE中搜索"区别分析"相关网站.
- →YODAO中搜索"区别分析"相关网站.
- 注意事项:
- ☉如果这个文档总是不能下载的请点击报告错误,谢谢合作!!
- ☉注意:下载文档后请第一时间查毒!文档太多,站长没可能都查过的,请自己小心点!谢谢合作!
- ☉欢迎广大作者给我们提供文档以及使用说明;如有其它问题,欢迎发信联系管理员,谢谢!
本类下载TOP10
数据载入中…