
1
前言
病例对照研究是流行病学观察性研究中最经典、最高频的设计类型,也是353考研的”钉子户”考点。2026年北京大学医学部这道真题,以”血糖升高与缺血性脑卒中”为研究主题,从病例选择策略到四格表计算,从OR值解释到混杂因素分层分析,最后以Mantel-Haenszel法合并OR值收尾,完整呈现了病例对照研究从设计到分析的全流程。
这道题最难的”坎”在第(4)问——根据边缘数据反推四格表缺失值。很多考生看到残缺的表格就慌了神,其实只要抓住”合计数守恒”和”总例数固定”两个锚点,就能像解数独一样层层剥开。今天,我们不仅教你算出答案,更教你在考场上3分钟锁定缺失值的思维路径。
2
真题再现
4、一项探索血糖升高与缺血性脑卒中关联的病例对照研究,纳入了缺血性脑卒中病例和对照各200例,并调查血糖升高的情况。
(1)简述病例对照研究中病例选择类型、来源和优缺点。
(2)上述调查发现分别有80名患者,40名对照暴露于血糖升高,请列出四格表,并计算关联强度指标(不要求95%可信区间),已知统计分析结果为P<0.05,具体意义是什么?
(3)研究者发现上述设计忽略年龄影响,结合分层分析思路,阐述应如何判断年龄是否为混杂因素?
(4)经过上述分析,研究者判断年龄可能起到混杂作用,为了控制年龄效应,按照研究对象年龄是否大于50岁列表,如表4所示,请计算表中空缺的数据(将整个表格写至专用答题纸上,并计算各层效应值)。(不计算95%置信区间)

(5)研究者对两层效应进行同质性检验,结果为P>0.05进而采用Mental-Haenszel法计算出ORMH=2.42,根据以上分析结果,做出适当的研究结论。
3
满分答案
(1)病例选择类型、来源和优缺点

①不同病例类型的类型及优缺点:
a.新发病例:
优点:1)包括不同病情和预后的病人,代表性好。2)病人确诊不久即被调查,对有关暴露的回忆信息较为准确可靠,不受各种预后因素的影响。3)病历资料容易获得。
缺点:在一定范围或时间内较难得到预期的病例数,尤其对于罕见病。
b.现患病例:
优点:可以在较小范围或较短时间内得到足够的病例数。
缺点:现患病例患病时间较长,对暴露史回忆的可靠程度比新发病例差,难以区分暴露与疾病发生的时间顺序。
c.死亡病例:
优点:对那些主要靠亲友提供资料的疾病如儿童白血病的研究,也不排除应用死亡病例,只是在资料整理和分析时要充分考虑到可能的偏倚。
缺点:死亡病例的暴露信息主要由其家属提供,准确性较差。
②病例的来源及不同来源病例的优缺点:
a.从医院选择病例:
优点:节省费用,合作性好,资料容易得到,而且信息较完整、准确。
缺点:不同医院接收的病人具有不同的特征,如果仅从一所医院选择病例,代表性较差。
b.从社区人群中选择病例:
优点:代表性好,结果推及该人群的可信程度较高。
缺点:调查工作比较困难,且耗费人力物力较多。
(2)四格表、关联强度与P值意义

① 四格表:

② 关联强度指标(OR值):

③ P<0.05的意义:
P值反映”病例组与对照组暴露率差异”的概率。若P<0.05,说明: - 病例组暴露率(80/200 = 40%)与对照组暴露率(40/200 = 20%)差异具有统计学意义 - 结合OR = 2.67 > 1,可推断:血糖升高与缺血性脑卒中存在统计学关联,血糖升高可能是缺血性脑卒中的危险因素
(3)判断年龄是否为混杂因素的分层分析思路

①分层: 将总人群按年龄是否>50岁分为两层(<50岁层和≥50岁层)
②计算各层OR值: 分别计算两层内血糖升高与缺血性脑卒中关联的OR₁(<50岁层)和OR₂(≥50岁层)
③比较分层OR与总OR(2.67):
若OR1≈OR2≈OR,说明年龄分布在病例组与对照组间均衡,年龄不是混杂因素;
若OR1和OR2与OR差异较大(如一层明显高于2.67,一层明显低于),且方向一致,说明年龄通过不均衡分布掩盖/夸大了血糖升高与脑卒中的关联,年龄是混杂因素。
④统计学验证: 采用Mantel-Haenszel法分层分析后的一致性检验辅助确认
⭐ 混杂因素三重标准回顾:①与暴露相关;②与结局独立相关;③不在因果链上。年龄若同时满足三者,即为混杂因素。
(4)分层四格表缺失值计算与各层效应值

①表格数据以外已知条件:
已知总病例数=200,总对照数=200,总暴露病例数=80,总暴露对照数=40
②数据推算:
<50岁组:
对照组血糖升高(b₁)=<50岁对照组合计-对照组无血糖升高=102-87=15;
病例组血糖升高(a₁)=<50岁血糖升高小计-对照组血糖升高=33-15=18;
病例组无血糖升高(c₁)=<50岁病例组合计-病例组血糖升高=40-18=22;
无血糖升高小计=22+87=109;
<50岁总小计=40+102=142(或33+109=142,验证一致)。
≥50岁组:
对照组血糖升高(b₂)=总暴露对照数-<50岁对照组暴露=40-15=25;
对照组无血糖升高(d₂)=≥50岁对照组合计-对照组血糖升高=98-25=73;
病例组无血糖升高(c₂)=≥50岁病例组合计-病例组血糖升高=160-62=98;
血糖升高小计=62+25=87;
无血糖升高小计=98+73=171;
≥50岁总小计=160+98=258。
①完整分层表格

②层效应值(OR)计算
<50岁层OR1=(a1×d1)/(b1×c1)=(18×87)/(15×22)=1566/330≈4.75;
≥50岁层OR2=(a2×d2)/(b2×c2)=(62×73)/(25×98)=4526/2450≈1.85。
(5)研究结论

两层效应同质性检验P>0.05,说明两层OR值具有同质性,可采用Mantel-Haenszel法合并OR(ORMH = 2.42)。结合上述分析:
控制年龄混杂因素后,ORMH = 2.42,仍大于1且具有统计学意义(结合之前总OR的P<0.05),表明血糖升高与缺血性脑卒中存在正关联
血糖升高者发生缺血性脑卒中的风险是血糖正常者的2.42倍,且该关联独立于年龄的影响,提示血糖升高可能是缺血性脑卒中的独立危险因素
4
知识点1:筛检试验基础指标体系
知识点1:病例对照研究设计核心要素


病例对照研究 vs 队列研究对比:

知识点2:OR值的流行病学解释体系


本题OR = 2.67的完整表述: - “血糖升高者发生缺血性脑卒中的风险是血糖正常者的2.67倍” - “血糖升高使缺血性脑卒中风险增加167%” - “若消除血糖升高暴露,可预防该人群中一定比例的发病”
知识点3:分层分析的逻辑框架与计算技巧

分层分析四步法:

知识点4:Mantel-Haenszel法与同质性检验


本题逻辑链: - 同质性检验P>0.05 → 两层OR同质(4.75和1.85虽有差异,但统计学上无显著异质性) - ORMH = 2.42 → 校正年龄后,关联仍存在但强度降低(从2.67降至2.42) - 说明原OR = 2.67部分被年龄混杂夸大,但血糖升高的独立效应依然存在
5
秒杀口诀
✔ 病例对照研究设计口诀
“病例对照回顾找,由果及因看暴露;OR值来算关联,混杂分层要记牢”
✔ 混杂因素判定口诀
“混杂三条件:暴露相关、结局相关、不在链上;缺一不是,全满足才是”
✔ 分层分析四步口诀
“一分层、二算OR、三检验同质、四M-H合并”
✔ OR值解释口诀
“OR等于1无关联,大于1是危险,小于1是保护;MH合并看混杂,校正之后更可靠”
6
下期预告
下一期我们将拆解北京协和医学院353的病例对照研究真题——“胃癌与饮茶关联的 hospital-based 病例对照研究偏倚分析”,这道题深度考查了入院率偏倚(Berkson偏倚)、回忆偏倚和调查偏倚的识别与控制,是理解病例对照研究偏倚体系的经典之作!
本文题目来源:
北京大学医学部 2026年真题
整理:卫灿公卫考研辅导团队

抢跑上岸 卫灿助你


点击查看 近期热门




给小卫点个赞吧ヾ(◍°∇°◍)ノ゙!
