HGVS
HGVS(Human Genome Variation Society,人类基因组变异协会)是一个致力于促进发现、表征和规范描述人类基因组变异的国际学术组织。
在临床遗传学和分子诊断领域,"HGVS" 一词通常直接指代该协会制定的HGVS命名法(HGVS Nomenclature)。这是一套全球通用的描述 DNA、RNA 和蛋白质序列变异(即突变)的标准规则。
它通过标准化的前缀(如 c.、p.、g.)和格式,确保了全球实验室在报告基因突变时消除歧义,是精准医学报告和数据库共享的“通用语”。
解码基因天书:HGVS 命名结构
一个标准的 HGVS 描述由三个部分组成:参考序列 + 前缀 + 具体变异。
| 层级 | 格式示例 | 含义解读 |
|---|---|---|
| DNA 层面 (c. / g.) |
NM_004006.2:c.435G>C |
在参考序列 NM_004006.2 (DMD基因) 的编码 DNA 第 435 位,碱基 G 突变为 C。 |
| 蛋白层面 (p.) |
p.Trp145Cys(或 p.W145C) |
第 145 位的色氨酸 (Trp) 变成了半胱氨酸 (Cys)。这是上述 DNA 突变的后果。 |
| 缺失 (del) |
c.12_14del |
编码区第 12 到 14 位碱基发生缺失。 |
| 移码 (fs) |
p.Arg97Profs*23 |
第 97 位 Arg 变 Pro 导致移码,并在其后第 23 个氨基酸处提前遇到终止密码子 (*)。 |
"c." 的坐标系统:不仅仅是数数
在临床报告中,c.(coding DNA)最为常用。它的计数起点是起始密码子 ATG 的 'A'(记为 +1),不包括 5' 非翻译区。
- 内含子表示法: 位于外显子边界的内含子变异,使用 +/- 标记。例如
c.123+1G>A表示第 123 位碱基所在的剪切供体位点(+1位置)发生了 G 到 A 的突变,这通常会导致严重的剪切错误。 - 非翻译区 (UTR):
• 5' UTR 使用负号:如c.-10G>T
• 3' UTR 使用星号:如c.*10G>T - 3' Rule (3'端法则): 当序列中存在重复片段(如 AAAAA),插入或缺失的位置可以在多个位点描述时,HGVS 规定:必须将变异位置定在尽可能靠 3' 端的位置。
关键相关概念 [Key Concepts]
1. Reference Sequence (参考序列): HGVS 命名的基石。常用的有 RefSeq (NCBI, 如 NM_000088.3) 和 LRG (Locus Reference Genomic)。必须注明版本号(如 .3),因为不同版本的序列长度可能不同,会导致坐标偏移。
2. MANE (Matched Annotation from NCBI and EMBL-EBI): 为了解决转录本选择混乱的问题,NCBI 和 EBI 联合推出的项目,旨在为每个基因确定一个“典型转录本”(MANE Select),作为临床报告的首选参考。
3. VEP (Variant Effect Predictor): 强大的生物信息学工具。可以自动将 VCF 文件中的原始坐标转换为符合 HGVS 标准的描述(如 chr1:123456 A/G -> NM_xyz:c.10A>G)。
学术参考文献 [Academic Review]
[1] den Dunnen JT, et al. (2016). HGVS Recommendations for the Description of Sequence Variants: 2016 Update. Hum Mutat.
[点评]:当前的“宪法”级文件。这是 HGVS 官方发布的最新版详细指南,正式确立了许多现代分子诊断(如 NGS)中使用的命名规则。
[2] Taschner PE, den Dunnen JT. (2011). Describing structural changes by extending HGVS sequence variation nomenclature. Hum Mutat.
[点评]:扩展了 HGVS 规则以适应复杂的结构变异(如易位、倒位),使其与细胞遗传学的 ISCN 标准接轨。