
1
前言
回归分析是卫生统计学从”单因素描述”走向”多因素推断”的核心工具,也是353考研中覆盖面最广、综合性最强的考点模块。2026年重庆医科大学这道真题,以”老年人营养状况与身体功能”为研究主题,用两张表格、五个问题,串联了置信区间解释、Pearson相关分析、简单线性回归、多重线性回归和Logistic回归五大技术。
这道题的难度梯度设计极为精妙:第(1)问考概念辨析(置信区间vs参考值范围),第(2)(3)问考双变量关系(相关+回归),第(4)问考多变量控制(多重回归),第(5)问考二分类结局(Logistic回归)。从简单到复杂,从连续到分类,完整覆盖了回归分析的技术光谱。
今天,我们不仅逐个击破这五问,更要建立“相关→回归→多重回归→广义线性模型”的完整认知链条!
2
真题再现
87、某研究欲调查某社区65岁及以上老年人的营养状况与身体功能,随机抽取了180名老年人,测量了以下指标:体重指数BMI(kg/m²)、蛋白质摄入量(g/天)、步行耐力(6分钟步行距离,m)、情绪状态评分(0~30,分数越高情绪越差)、是否功能受限(是=1,否=0)。
表1 多重线性回归结果

表2 Logistic回归结果

(1)研究者估计了体重指数BMI的总体均数的95%置信区间为22.825.2(kg/m²),得出结论该社区体重指数BMI在22.825.2(kg/m²)之间的老年人约占95%,请评价该结论。
(2)研究者报告情绪状态评分与步行耐力的线性相关系数r=-0.5,p<0.01,由此可以得出什么结论?
(3)研究者以情绪状态评分为自变量X,步行耐力为因变量Y,计算得直线回归方程:Ŷ=450-10X,决定系数R²=0.25,请解释回归系数-10和R²=0.25的含义。
(4)研究者将体重指数BMI、蛋白质摄入量、情绪状态评分同时纳入模型,以步行耐力为因变量,建立多重线性回归模型,计算得决定系数R²=0.49,回归系数与P值如表1,请解释情绪状态评分回归系数-5和R²=0.49的含义。
(5)以是否功能受限(是=1,否=0)为因变量,纳入体重指数BMI、步行耐力、情绪状态评分建立logistic回归模型,计算得OR值及95%CI,结果如表2,请对表2结果进行解释。
3
满分答案
(1)置信区间结论的评价

结论:该结论是错误的。
研究者给出的结论是:“该社区体重指数BMI在22.8~25.2(kg/m²)之间的老年人约占95%”。 这个结论是错误的。
95%置信区间的含义是:重复抽样100次,有95次计算出的区间会包含总体均数的真实值,它是对总体均数范围的估计,而不是对个体值分布范围的描述。正确的表述应为:“我们有95%的把握认为,该社区老年人BMI的总体均数在22.8~25.2(kg/m²)之间”。
(2)Pearson相关系数的结论

相关系数r=-0.5,说明情绪状态评分与步行耐力之间存在中等强度的负线性相关:情绪状态评分越高(情绪越差),步行耐力越差;反之,情绪状态评分越低(情绪越好),步行耐力越好。
p<0.01,说明这种负相关关系在统计学上是显著的,不是由抽样误差造成的。
注意:相关≠因果!不能得出”情绪差导致步行耐力下降”的因果结论。
(3)简单线性回归方程的解释

回归方程:Ŷ = 450-10X(X:情绪状态评分,Y:步行耐力)
① 回归系数 b = -10 的含义:
在其他条件不变的情况下,情绪状态评分每增加1分(情绪变差1个单位),步行耐力平均减少10米。
② 决定系数 R² = 0.25 的含义:
步行耐力的总变异中,有25%可以由情绪状态评分的变化来解释,剩余75%的变异由其他因素或随机误差导致。
📌 R²的实质:反映模型的解释力或预测价值。R²=0.25说明情绪状态评分对步行耐力有一定预测作用,但解释力有限。
(4)多重线性回归结果的解释

①回归系数-5:在控制了BMI和蛋白质摄入量的影响后,情绪状态评分每增加1分(情绪变差),步行耐力平均减少5米,负相关关系依然存在,但效应较单因素分析时减弱。
②决定系数R²=0.49:步行耐力的总变异中,有49%可以由这三个自变量(BMI、蛋白质摄入量、情绪状态评分)共同解释,说明这个多重回归模型的拟合效果比单变量回归好很多。
(5)Logistic回归结果的解释

①BMI:OR=0.95,95%CI=(0.88, 1.02)。OR值小于1,提示BMI升高可能与功能受限风险降低有关,但95%CI包含了1,说明这种关联在统计学上不显著,不能认为BMI是功能受限的影响因素。
②步行耐力:OR=0.92,95%CI=(0.86, 0.97)。OR值小于1,且95%CI不包含1,说明步行耐力每增加1米,功能受限的发生风险平均降低8%(1-0.92),步行耐力越好,功能受限的风险越低,且这种关联是显著的。
③情绪状态评分:OR=1.08,95%CI=(1.02, 1.14)。OR值大于1,且95%CI不包含1,说明情绪状态评分每增加1分(情绪变差),功能受限的发生风险平均增加8%,情绪越差,功能受限的风险越高,且这种关联是显著的。
4
核心知识点复习
知识点1:置信区间vs参考值范围的终极辨析


记忆窍门:置信区间窄而精准(估计总体),参考值范围宽而包容(覆盖个体)。
知识点2:相关分析与回归分析的辨析


关键公式:

知识点3:Logistic回归的OR值解释体系


OR值的两种解读方式:

5
秒杀口诀
✔ 置信区间vs参考值范围口诀
“置信区间估总体,参考范围看个体;一个窄来精准算,一个宽来覆盖齐”
✔ 相关回归辨析口诀
“相关对称不分家,回归定向有因娃;r值范围正负一,b值单位看变量”
✔ 简单回归系数解释口诀
“X每变一个单位,Y平均变b个;正负看方向,大小看强度”
✔ 多重回归系数解释口诀
“控制其他变量后,X每变一单位,Y平均变b个;简单多重对比看,混杂暴露在其中”
✔ Logistic回归OR解释口诀
“OR大于1是危险,小于1是保护;包含1来无意义,不包含来有意义;风险增减百分比,一减OR再乘百”
✔ R²解释口诀
“R平方看解释力,百分之几变异清;零点二五弱预测,零点五零中水平”
6
下期预告
下一期我们将拆解华中科技大学353的生态学研究真题——“儿童近视与太阳光照时长的生态学谬误分析”,这道题以R²=0.95的强相关为诱饵,考查考生能否识别生态学谬误、相关≠因果以及混杂偏倚三大陷阱,是卫生统计学中”数字会说话,但会说谎话”的经典教案!
关注本号,持续更新2026年卫生统计学典型真题拆解,助你353专业课高分上岸!
本文题目来源:重庆医科大学353 2026年真题
整理:卫灿公卫考研辅导团队

抢跑上岸 卫灿助你


点击查看 近期热门





给小卫点个赞吧ヾ(◍°∇°◍)ノ゙!
