您好,登录后才能下订单哦!
密码登录
登录注册
点击 登录注册 即表示同意《亿速云用户服务条款》
# influencePlot()函数发现离群点、杠杆点与强影响点的示例分析
## 一、引言
在回归分析中,识别数据中的**离群点(Outliers)**、**杠杆点(High-Leverage Points)**和**强影响点(Influential Observations)**对模型诊断至关重要。R语言中的`influencePlot()`函数(来自`car`包)通过可视化方法综合呈现这三类特殊观测点,本文将结合示例展示其应用场景与解读方法。
---
## 二、函数原理与核心指标
`influencePlot()`基于以下三个统计量绘制气泡图:
1. **学生化残差(Studentized Residuals)**
标识离群点,绝对值越大表明观测值与模型预测差异越大。
2. **帽子值(Hat Values, Leverage)**
度量杠杆效应,值越大说明自变量组合越异常。
3. **Cook距离(Cook's Distance)**
量化强影响性,反映删除该观测后回归系数的变化程度。
气泡大小通常与Cook距离成正比,直观显示影响力强度。
---
## 三、示例演示
### 1. 数据准备与模型构建
```r
library(car)
data(mtcars)
model <- lm(mpg ~ wt + hp + qsec, data = mtcars)
influencePlot(model, id.method = "identify",
main = "Influence Plot for mtcars Model")
函数返回一个数据框,包含显著点的统计量:
StudRes Hat CookD
Maserati Bora 3.0528291 0.29181222 1.5500968
Toyota Corolla -2.1430172 0.08525724 0.1192064
图形特征(见图1): - X轴:杠杆值(0到1) - Y轴:学生化残差(±2为常见阈值) - 气泡大小:Cook距离(>0.5需警惕)
图1:mtcars回归模型的影响图
诊断验证
使用qqPlot()
验证残差正态性,vif()
检查共线性。
qqPlot(model)
vif(model)
稳健性处理
rlm()
)结果对比
比较删除异常点前后模型的summary()
输出。
influencePlot()
通过三合一可视化高效定位:
- 离群点 → 影响模型精度
- 杠杆点 → 扭曲自变量关系
- 强影响点 → 改变回归结论
建议将此函数作为回归诊断的标准流程,配合其他工具(如plot(model)
)全面评估模型质量。
注意:实际分析中需结合领域知识判断是否保留特殊点,避免过度依赖统计阈值。 “`
注:实际使用时需替换示例图中的占位链接,并确保已安装car
包。本文以R 4.3.0环境为例,字符数(含代码)约750字。
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。