之美:如何进行回归分析"/>
数据分析之美:如何进行回归分析
1. 确定自变量与Y是否相关
例子: Is there a relationship between advertising sales(销售额) and budget(广告预算:TV, radio, and newspaper)? the p-value corresponding to the F-statistic in Table 3.6 is very low, indicating clear evidence of a relationship between advertising and sales.
背景知识回顾:
t-statistic T统计量(t检验)与F-statistict-statistic T统计量=(回归系数β的估计值-0)/β的标准误 ,which measures the number of standard deviations thatβis away from 0。用来对计量经济学模型中关于参数的单个假设进行检验的一种统计量。 我们一般用t统计量来检验回归系数是否为0做检验。例如:线性回归Y=β0+β1X,为了验证X与Y是否相关, 假设H0:X与Y无关,即β1=0 假设H1:X与Y相关,即β1不等于0 计算t-statistic, 如果t-statistic is far away from zero,则x和y相关。一般用p-values来检验X和Y是否相关。
1)p-values(Probability,Pr) 1 定义 pvalue的定义:在原假设正确的情况下,出现当前情况或者更加极端情况的概率。 p值是用来衡量统计显著性的常用指标。 P值( P-Value,Probability,Pr)即概率,反映某一事件发生的可能性大小。统计学根据显著性检验方法所得到的P 值,一般以P < 0.05 为显著, P <0.01 为非常显著,其含义是样本间的差异由抽样误差所致的概率小于0.05 或0.01。实际上,P 值不能赋予数据任何重要性,只能说明某事件发生的机率。 假设检验是推断统计中的一项重要内容。在假设检验中常见到P 值( P-Value,Probability,Pr),P 值是进行检验决策的另一个依据。 大的pvalue说明还没有足够的证据拒绝原假设。 2 为何有p-value P值方法的思路是先进行一项实验,然后观察实验结果是否符合随机结果的特征。研究人员首先提出一个他们想要推翻的“零假设”(null hypothesis),比如,两组数据没有相关性或两组数据没有显著差别。接下来,他们会故意唱反调,假设零假设是成立的,然后计算实际观察结果与零假设相吻合的概率。这个概率就是P值。费希尔说,P值越小,研究人员成功证明这个零假设不成立的可能性就越大。
其实理解起来很简单,基本原理只有两个: 1)一个命题只能证伪,不能证明为真 2)小概率事件不可能发生 证明逻辑就是:我要证明命题为真->证明该命题的否命题为假->在否命题的假设下,观察到小概率事件发生了->搞定。 3 demo 投飞镖,假设一个飞镖有10,9,8,7,6,5,4,3,2,1总共十个环(10是中心),定义合格
更多推荐
数据分析之美:如何进行回归分析
发布评论