卫生统计学
卫生统计学(Health Statistics / Medical Statistics),又称医学统计学,是一门运用概率论和数理统计的原理,来研究医学和卫生领域中数据的收集、整理和分析的学科。
它是循证医学 (EBM) 的核心工具。因为生物体存在普遍的个体差异(Variability),我们无法仅凭一个个案就得出普遍规律。卫生统计学的作用就是从杂乱的变异中寻找客观规律,通过假设检验(如 $P$ 值)来区分“偶然误差”与“本质差异”。它是评价新药疗效、追踪流行病趋势以及制定卫生政策的根本依据。
核心:设计决定命运
统计学不只是事后的数据处理,更重要的是事前的科研设计。设计如有缺陷,再高级的算法也无法挽救(Garbage In, Garbage Out)。
- 随机化 (Randomization): 统计学的灵魂。通过随机分配(如抛硬币)将患者分入治疗组和对照组,确保两组在基线上的均衡,消除混杂偏倚。
- 对照 (Control): “没有比较就没有鉴别”。设立安慰剂对照或标准治疗对照,以排除疾病自愈或心理作用(霍桑效应)的影响。
- 盲法 (Blinding): 防止主观偏见。单盲(患者不知)、双盲(医患均不知)、三盲(统计师也不知)。
神坛上的 $P$ 值:统计学意义 vs 临床意义
$P < 0.05$ 是医学论文发表的“金标准”,但它常被误读。
| 概念 | 统计学意义 (Statistical Significance) | 临床意义 (Clinical Importance) |
|---|---|---|
| 判断标准 | $P < 0.05$ | 疗效差值的大小、副作用、成本。 |
| 含义 | “这种差异不太可能是偶然造成的。” | “这种差异对患者的生命有实际价值。” |
| 样本量影响 | 样本量极大时,极微小的差异也会有 $P < 0.05$。 | 与样本量无关,只关乎效果本身。 |
警示:一个新药如果能让血压下降 0.1 mmHg 且 $P < 0.01$,它具有统计学意义,但毫无临床意义。
关键相关概念 [Key Concepts]
1. Confidence Interval (置信区间): 比 $P$ 值更重要的指标。通常是 95% CI。它不仅告诉我们“有没有差异”,还告诉我们“差异大概是多少”(范围),提供了精确度的信息。
2. Type I & II Error (I型和II型错误):
• I型错误 ($\alpha$): 假阳性(冤枉好人)。本来无效,统计说有效。
• II型错误 ($\beta$): 假阴性(放纵坏人)。本来有效,统计没发现。**效能 (Power)** 就是 $1-\beta$,科研设计时必须保证足够的样本量以提高效能。
3. Meta-analysis (Meta分析): 统计学的集大成者。通过数学方法合并多个同类研究的结果,增加样本量,是循证医学证据金字塔的塔尖。
学术参考文献 [Academic Review]
[1] 孙振球, 徐勇勇. (2014). 医学统计学 (第4版). 人民卫生出版社.
[点评]:中国医学统计学的“红宝书”。研究生入学考试和科研工作的案头必备,严谨地阐述了统计学原理与SAS/SPSS操作。
[2] Altman DG. (1990). Practical Statistics for Medical Research. CRC Press.
[点评]:国际经典教材。作者是 BMJ 的统计学顾问,该书以“为了让医生读懂”而著称,极少堆砌公式,重在逻辑。
[3] Schulz KF, et al. (2010). CONSORT 2010 Statement: updated guidelines for reporting parallel group randomised trials. BMJ.
[点评]:临床试验报告的国际标准。规定了发论文时必须汇报的统计学细节(如随机化方法、样本量计算依据)。