相关性模型-相关系数

发布时间：2020-08-08 10:41:37 作者：vizier
来源：ITPUB博客阅读：604

相关系数可用来衡量两个变量之间的相关性大小，根据数据满足的不同条件，选择不同的相关系数进行计算分析。

两种常用的相关系数：皮尔逊person和斯皮尔曼spearman。

总体和样本：

相关性模型-相关系数

皮尔逊相关系数：（要求数据要都是符合正态分布的数据，而且数据需线性相关）

必须先确认两个变量时线性相关的（ 画样本散点图先观察是否线性），然后此系数才能告诉他们相关程度如何。如果计算的相关系数为0，只能说明非线性相关。

相关性模型-相关系数

不能说协方差大的两个变量比协方差小的两个变量更相关，因为没有消除变量的量纲的影响。皮尔逊相关系数就是协方差消除量纲后的结果。

相关性模型-相关系数

样本皮尔逊相关系数同总体皮尔逊相关系数：

相关性模型-相关系数

由于皮尔逊相关系数只是衡量已知线性相关的两个变量的相关程度，其他情况不适用：

相关性模型-相关系数

相关性模型-相关系数

对相关性大小的解释：

根据具体事情具体分析，没有标准大小的阈值规定。比起相关系数大小，我们更关注其显著性。（假设检验）

对皮尔逊相关系数进行假设检验：

如：求出相关系数r=0.3，问是否和0（非线性相关）有显著差异?

经假设检验求出03与0有显著差异的，就可说明变量的相关性是显著的；若求出0.3和0没有显著差异，可说明变量并不相关，相关系数不显著。

步骤：

相关性模型-相关系数

对皮尔逊相关系数构造统计变量，知道统计量的分布，就可以画出统计变量的概率密度函数。将计算出的皮尔曼相关系数带入统计变量，得到一个检验值，根据置信水平画出统计变量接受域和拒绝域，看检验值是否落在接受域。

相关性模型-相关系数

相关性模型-相关系数

相关性模型-相关系数

除了根据表格找接受域拒绝域的临界值之外，更好用的方法：

相关性模型-相关系数

对皮尔逊相关系数假设检验的条件：

检验数据是否是正态分布：

①JB检验：

相关性模型-相关系数

②夏皮洛-威尔克检验

③QQ图（要求数据量要非常大）

相关性模型-相关系数

斯皮尔曼相关系数：

小样本情况：

相关性模型-相关系数

大样本情况：

相关性模型-相关系数

总结：

相关性模型-相关系数

推荐阅读：

免责声明：本站发布的内容（图片、视频和文字）以原创、转载和分享为主，文章观点不代表本网站立场，如果涉及侵权请联系站长邮箱：is@yisu.com进行举报，并提供相关证据，一经查实，将立刻删除涉嫌侵权内容。

模型相关相关性

上一篇：MySQL购InnoDB不敌甲骨文宣布开放数据引擎(转)

下一篇：链接服务器的OLE DB访问接口报错。由于达到了资源限制，提供程序终止了执行。

相关阅读

您好，登录后才能下订单哦！

密码登录

忘记密码？

登录注册

获取短信验证码

其他方式登录

点击登录注册即表示同意《亿速云用户服务条款》

行业资讯-文章归档问答-问答归档