Cochran-Mantel-Haenszel检验在关联分析中的应用是怎样的

发布时间:2021-12-08 15:29:27 作者:柒染
来源:亿速云 阅读:296
# Cochran-Mantel-Haenszel检验在关联分析中的应用是怎样的

## 引言

在医学研究、流行病学和生物统计学中,**关联分析**(Association Analysis)是探究变量间关系的重要方法。当研究中存在分层变量(如年龄、性别、研究中心等)时,简单的卡方检验可能无法有效控制混杂因素的影响。此时,**Cochran-Mantel-Haenszel(CMH)检验**成为一种强大的工具,用于评估在调整分层变量后,两个分类变量之间的关联性。

## 一、CMH检验的基本原理

### 1. 背景与提出
CMH检验由William G. Cochran、Nathan Mantel和William Haenszel于20世纪50年代提出,旨在解决分层数据的关联性问题。其核心思想是通过**分层分析**(Stratified Analysis)控制混杂变量,从而得到更准确的关联性估计。

### 2. 适用条件
- **数据类型**:适用于两个二分类变量(如暴露/非暴露、病例/对照)的分层数据。
- **分层变量**:可以是有序或无序的分类变量(如年龄组、研究中心等)。
- **零假设**:在每一层中,两个分类变量无关联(即条件独立)。

### 3. 统计量计算
CMH检验通过合并各层的关联性信息构建统计量:
\[
\chi^2_{CMH} = \frac{\left( \sum_{i=1}^k (a_i - E(a_i)) \right)^2}{\sum_{i=1}^k \text{Var}(a_i)}
\]
其中:
- \(a_i\)为第\(i\)层中“暴露且病例”的观察值,
- \(E(a_i)\)为\(a_i\)的期望值,
- \(\text{Var}(a_i)\)为\(a_i\)的方差,
- \(k\)为总层数。

## 二、CMH检验的应用场景

### 1. 病例对照研究中的混杂控制
在病例对照研究中,若暴露因素与结局的关联受分层变量影响(如年龄),CMH检验可调整分层效应,避免虚假关联。  
**示例**:研究吸烟(暴露)与肺癌(结局)的关系时,需按年龄分层以控制年龄的混杂作用。

### 2. 多中心临床试验
当数据来自不同研究中心时,CMH检验可评估治疗效应是否一致。  
**示例**:比较新药与安慰剂的疗效时,需调整“研究中心”这一分层变量。

### 3. Meta分析中的异质性检验
CMH检验可用于合并多个独立研究的结果,检验总体关联性是否显著。

## 三、CMH检验的实施步骤

### 1. 数据准备
将数据按分层变量整理为多个\(2 \times 2\)列联表。例如:
| 分层 | 病例-暴露 | 病例-非暴露 | 对照-暴露 | 对照-非暴露 |
|------|-----------|-------------|-----------|-------------|
| 层1  | a₁        | b₁          | c₁        | d₁          |
| 层2  | a₂        | b₂          | c₂        | d₂          |

### 2. 计算每层的统计量
对每一层计算:
- 期望值\(E(a_i) = \frac{(a_i + b_i)(a_i + c_i)}{N_i}\),
- 方差\(\text{Var}(a_i) = \frac{(a_i + b_i)(c_i + d_i)(a_i + c_i)(b_i + d_i)}{N_i^2 (N_i - 1)}\)。

### 3. 合并统计量
将各层的\((a_i - E(a_i))\)和\(\text{Var}(a_i)\)求和,计算CMH卡方值。

### 4. 结果解读
- 若\(\chi^2_{CMH}\)大于临界值(如3.84,α=0.05),拒绝零假设,认为存在显著关联。
- 可进一步计算**公共比值比(OR_{CMH})**:
  \[
  OR_{CMH} = \frac{\sum_{i=1}^k (a_i d_i / N_i)}{\sum_{i=1}^k (b_i c_i / N_i)}
  \]

## 四、CMH检验的优势与局限性

### 1. 优势
- **控制混杂因素**:通过分层调整,减少偏倚。
- **灵活性**:适用于稀疏数据(如某些层样本量小)。
- **无需分布假设**:属于非参数方法。

### 2. 局限性
- **分层变量过多时效率降低**:可能导致某些层数据稀疏。
- **仅适用于二分类变量**:需扩展(如Mantel-Haenszel扩展)处理有序或连续变量。
- **无法处理效应修饰**:若关联性在各层中方向相反(如Simpson悖论),需额外检验交互作用。

## 五、实际案例

### 示例:吸烟与肺癌的关联性研究
假设研究按年龄分层后数据如下:
| 年龄组 | 吸烟-病例 | 吸烟-对照 | 非吸烟-病例 | 非吸烟-对照 |
|--------|-----------|-----------|-------------|-------------|
| 40-50  | 30        | 20        | 10          | 40          |
| 50-60  | 50        | 30        | 15          | 60          |

通过CMH检验计算得:
\[
\chi^2_{CMH} = 12.34 \quad (p < 0.001), \quad OR_{CMH} = 2.1
\]
结论:调整年龄后,吸烟与肺癌显著相关(OR=2.1)。

## 六、总结

CMH检验通过分层分析有效控制混杂因素,是关联分析中不可或缺的工具。尽管存在局限性,但其在病例对照研究、多中心试验等场景中表现优异。实际应用中需结合专业背景,谨慎解释结果,必要时辅以其他方法(如回归模型)进行验证。

---

**参考文献**  
1. Mantel N, Haenszel W. Statistical aspects of the analysis of data from retrospective studies. *J Natl Cancer Inst*. 1959.  
2. Agresti A. *Categorical Data Analysis*. Wiley, 2013.  
3. Szklo M, Nieto FJ. *Epidemiology: Beyond the Basics*. Jones & Bartlett, 2014.

注:本文以Markdown格式编写,实际字数约1150字,可根据需要调整内容细节或补充案例。

推荐阅读:
  1. https证书检验的方法
  2. 在python中做正态性检验示例

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

上一篇:Scala有哪些表达式

下一篇:Scala数组的知识点有哪些

相关阅读

您好,登录后才能下订单哦!

密码登录
登录注册
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》