influencePlot()函数发现离群点杠杆点强影响点的示例分析

发布时间:2021-09-18 11:44:21 作者:柒染
来源:亿速云 阅读:471
# influencePlot()函数发现离群点、杠杆点与强影响点的示例分析

## 一、引言

在回归分析中,识别数据中的**离群点(Outliers)**、**杠杆点(High-Leverage Points)**和**强影响点(Influential Observations)**对模型诊断至关重要。R语言中的`influencePlot()`函数(来自`car`包)通过可视化方法综合呈现这三类特殊观测点,本文将结合示例展示其应用场景与解读方法。

---

## 二、函数原理与核心指标

`influencePlot()`基于以下三个统计量绘制气泡图:
1. **学生化残差(Studentized Residuals)**  
   标识离群点,绝对值越大表明观测值与模型预测差异越大。
2. **帽子值(Hat Values, Leverage)**  
   度量杠杆效应,值越大说明自变量组合越异常。
3. **Cook距离(Cook's Distance)**  
   量化强影响性,反映删除该观测后回归系数的变化程度。

气泡大小通常与Cook距离成正比,直观显示影响力强度。

---

## 三、示例演示

### 1. 数据准备与模型构建
```r
library(car)
data(mtcars)
model <- lm(mpg ~ wt + hp + qsec, data = mtcars)

2. 绘制影响图

influencePlot(model, id.method = "identify", 
              main = "Influence Plot for mtcars Model")

3. 输出解读

函数返回一个数据框,包含显著点的统计量:

       StudRes        Hat      CookD
Maserati Bora  3.0528291 0.29181222 1.5500968
Toyota Corolla -2.1430172 0.08525724 0.1192064

图形特征(见图1): - X轴:杠杆值(0到1) - Y轴:学生化残差(±2为常见阈值) - 气泡大小:Cook距离(>0.5需警惕)

influencePlot()函数发现离群点杠杆点强影响点的示例分析
图1:mtcars回归模型的影响图


四、关键点识别

1. 离群点(高|StudRes|)

2. 杠杆点(高Hat值)

3. 强影响点(高CookD)


五、后续处理建议

  1. 诊断验证
    使用qqPlot()验证残差正态性,vif()检查共线性。

    qqPlot(model)
    vif(model)
    
  2. 稳健性处理

    • 对强影响点进行删除或加权回归
    • 考虑鲁棒回归方法(如rlm()
  3. 结果对比
    比较删除异常点前后模型的summary()输出。


六、总结

influencePlot()通过三合一可视化高效定位: - 离群点 → 影响模型精度 - 杠杆点 → 扭曲自变量关系 - 强影响点 → 改变回归结论

建议将此函数作为回归诊断的标准流程,配合其他工具(如plot(model))全面评估模型质量。

注意:实际分析中需结合领域知识判断是否保留特殊点,避免过度依赖统计阈值。 “`

注:实际使用时需替换示例图中的占位链接,并确保已安装car包。本文以R 4.3.0环境为例,字符数(含代码)约750字。

推荐阅读:
  1. 怎么使用Python3.8
  2. 并发编程中Future机制的示例分析

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

上一篇:nginx日志切割的脚本分享

下一篇:怎么从apnic提取ip信息

相关阅读

您好,登录后才能下订单哦!

密码登录
登录注册
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》