数模算法:典型相关分析"/>
数模算法:典型相关分析
引入:
典型相关分析(Canonical Correlation analysis) 研究两组变量(每组变量中都可能有多个指标) 之间相关关系的一种多元统计方法。它能够揭示 出两组变量之间的内在联系。
定义
典型相关分析由Hotelling提出,其基本思想和主成分分析非常相似。 首先在每组变量中找出变量的线性组合,使得两组的 线性组合之间具有最大的相关系数; 然后选取和最初挑选的这对线性组合不相关的线性组 合,使其配对,并选取相关系数最大的一对; 如此继续下去,直到两组变量之间的相关性被提取完 毕为此。 被选出的线性组合配对称为典型变量,它们的相关系 数称为典型相关系数。典型相关系数度量了这两组变量之 间联系的强度。
思路:
步骤(利用SPSS分析数据)
(1)数据的分布有假设:两组数据服从联合正态分布。
(2)首先要对两组变量的相关性进行检验(构造似然比统计量)。p值小于0.5(0.1)表示在95%(90%)的置信水平下拒绝原假设,即认为两组变量有关。
(3)确定典型相关变量的个数(直接看典型相关系数对应的P值即可)
(4)利用标准化后的典型相关变量分析问题
(5)进行典型载荷分析
(6)计算前r个典型变量对样本总方差的贡献
实例
体重,腰围,脉搏为生理指标,引体向上,起做次数,跳跃次数为训练指标,对生理指标和训练指标进行典型相关分析
导入数据到spss,注意变量类型统一成标度
点击典型相关性分析
指标归类移到相应集合位置
结果
通过这步写出标准化后的典型变量 (根据上一步确定个数来写,有几个显著的典型相关性系数就要写几对出来)
形式
典型载荷:分析某组变量与其中的指标的相关性
交叉载荷:分析一组变量与另一组中的指标的想关性
建模应用
2012年国赛A题葡萄酒的评价 问题三
更多推荐
数模算法:典型相关分析
发布评论