流行病学作为公共卫生与预防医学的核心学科,其考博选拔中常通过计算题考察考生的逻辑思维、数据解读与应用能力,这类题目通常基于流行病学基本原理,结合发病率、患病率、比值比、归因危险度等核心指标,要求考生准确理解公式含义、掌握数据适用条件并能结合实际问题进行推演,以下从常见考点、解题思路及实例分析展开详细阐述。

流行病学考博计算题的核心考点与解题框架
流行病学计算题的考点分布相对集中,主要围绕疾病频率测量、关联强度分析、偏倚控制及研究设计评价等模块,考生需首先明确题目研究背景(如横断面研究、队列研究、病例对照研究),识别数据类型(如人数、事件数、时间单位),再匹配对应公式进行计算,以下是高频考点及关键公式梳理:
疾病频率测量指标
-
发病率:表示一定时期内特定人群中某病新发病例的频率,多用于队列研究,公式为:
[ \text{发病率} = \frac{\text{某时期内某病新发病例数}}{\text{同期暴露人口数}} \times k \quad (k=100\%, 1000‰\text{等}) ]
注意:分母为暴露人口,需排除研究开始时已患病者;时间单位需明确(如人年、人月)。 -
患病率:特定时间点或时期内特定人群中某病新旧病例的占比,多用于横断面研究,公式为:
[ \text{患病率} = \frac{\text{某时期某病新旧病例数}}{\text{同期平均人口数}} \times k ]
注意:与发病率的关系:患病率≈发病率×病程(当病程稳定时)。
关联强度与效应量指标
-
相对危险度(RR):队列研究中衡量暴露组与非暴露组发病风险的比值,反映暴露与疾病的关联强度,公式为:
[ RR = \frac{\text{暴露组发病率} (I_e)}{\text{非暴露组发病率} (I_u)} = \frac{a/(a+b)}{c/(c+d)} ]
解读:RR>1表示暴露为危险因素,RR<1表示保护因素,RR=1表示无关联。
(图片来源网络,侵删) -
比值比(OR):病例对照研究中衡量病例组与对照组暴露史比值比的指标,用于估计RR(当疾病罕见时,OR≈RR),公式为:
[ OR = \frac{\text{病例组暴露比值}}{\text{对照组暴露比值}} = \frac{a/c}{b/d} = \frac{ad}{bc} ]
注意:适用于回顾性研究,无需计算发病率。 -
归因危险度(AR):暴露组中由暴露因素导致的发病风险部分,反映绝对效应,公式为:
[ AR = I_e - I_u = Iu \times (RR - 1) ]
人群归因危险度(PARP):人群中由暴露导致的发病占比,公式为:
[ PARP = \frac{I{pop} - Iu}{I{pop}} \times 100\% ]
(I_{pop}) 为人群发病率。
样本量估算与偏倚校正
-
病例对照研究样本量估算:基于OR、α值(通常取0.05)、把握度(1-β,通常取0.8)及对照组暴露率((p0))计算,公式为:
[ n = \frac{(Z{\alpha/2} \sqrt{2p(1-p)} + Z_{\beta} \sqrt{p_1(1-p_1) + p_0(1-p_0)})^2}{(p_1 - p_0)^2} ]
(p_1 = \frac{p_0 \times OR}{1 + p_0(OR-1)}),(p = (p_0 + p_1)/2)。 -
失偏倚校正:队列研究中若存在失访,需通过校正分母(如人年计算)或采用意向性分析(ITT)控制偏倚,人年计算公式为:
[ \text{总人年} = \sum (\text{某时期人数} \times \text{观察时间}) ]
(图片来源网络,侵删)
典型计算题实例与步骤解析
例1:队列研究中的发病率与RR计算 某研究纳入1000名吸烟者(暴露组)和1200名非吸烟者(非暴露组),随访5年,结果暴露组发生肺癌150例,非暴露组发生肺癌30例,计算两组发病率、RR及AR。
解题步骤:
-
计算发病率:
- 暴露组发病率 (I_e = \frac{150}{1000} \times 100000/10万 = 1500/10万)
- 非暴露组发病率 (I_u = \frac{30}{1200} \times 100000/10万 = 250/10万)
-
计算RR:
[ RR = \frac{I_e}{I_u} = \frac{1500/10万}{250/10万} = 6.0 ]
解读:吸烟者肺癌发病风险是非吸烟者的6倍。 -
计算AR:
[ AR = I_e - I_u = 1500/10万 - 250/10万 = 1250/10万 ]
解读:吸烟者中,每10万例肺癌中有1250例由吸烟导致。
例2:病例对照研究中的OR计算与可信区间估计 某病例对照研究纳入肺癌病例200例,对照300例,其中病例组中吸烟120例,对照组中吸烟90例,计算OR及其95%可信区间(CI)。
解题步骤:
- 整理四格表:
| 吸烟 | 不吸烟 | 合计 | |
|---|---|---|---|
| 病例组 | 120 | 80 | 200 |
| 对照组 | 90 | 210 | 300 |
| 合计 | 210 | 290 | 500 |
-
计算OR:
[ OR = \frac{ad}{bc} = \frac{120 \times 210}{80 \times 90} = \frac{25200}{7200} = 3.5 ]
解读:吸烟者患肺癌的风险是不吸烟者的3.5倍。 -
计算OR的95%CI:
采用Woolf法,计算OR的自然对数标准误:
[ SE(\ln OR) = \sqrt{\frac{1}{a} + \frac{1}{b} + \frac{1}{c} + \frac{1}{d}} = \sqrt{\frac{1}{120} + \frac{1}{80} + \frac{1}{90} + \frac{1}{210}} \approx 0.213 ]
95%CI = (\ln OR \pm 1.96 \times SE(\ln OR)) = (1.253 \pm 1.96 \times 0.213) = (0.836, 1.670)
取反对数后,OR的95%CI = (2.31, 5.31)。
解读:95%CI不包含1,提示吸烟与肺癌的关联具有统计学意义。
解题策略与注意事项
- 明确研究设计类型:题目若提及“前瞻性”“随访”,多为队列研究(用发病率、RR);若提及“回顾性”“病例对照”,则为病例对照研究(用OR)。
- 检查数据一致性:如四格表数据行列合计是否匹配,发病率分母是否包含暴露人群,避免因粗心导致计算错误。
- 理解指标的实际意义:RR/OR反映关联强度,AR/PARP反映公共卫生意义,需结合题目背景解读结果,而非仅给出数值。
- 掌握简化计算技巧:如大样本数据可用“率”代替“概率”计算,OR可信区间可使用Miettnen法简化((OR^{1 \pm 1.96/ \sqrt{\chi^2}}))。
相关问答FAQs
Q1:在队列研究中,若暴露组和非暴露组失访率不同,如何校正发病率计算?
A1:失访会导致分母低估,进而高估发病率,校正方法有两种:① 若失访原因与暴露/疾病无关,可用“初始人数-失访人数”作为校正分母;② 若能获取失访者结局信息,可采用“意向性分析”(ITT),即所有纳入对象无论是否失访均计入原组别分母;③ 若失访与暴露/疾病相关,需通过多变量模型(如Cox回归)控制混杂因素,计算校正后的发病率比(IRR)。
Q2:病例对照研究中,若对照组暴露率高于一般人群,如何对OR进行校正?
A2:这种情况可能导致OR高估关联强度(因对照组选择偏倚),校正方法需借助人群暴露率((P_{pop}))和对照组暴露率((P0))进行标准化:
① 计算标准化OR:(OR{std} = OR \times \frac{P_{pop}(1-P_0)}{P0(1-P{pop})});
② 若已知人群发病率,可通过Miettnen法计算校正后的OR可信区间;
③ 更优方案是通过设计阶段控制(如人群对照)或分析阶段匹配(如年龄、性别匹配),减少选择偏倚。
