DOI
DOI(Digital Object Identifier,数字对象唯一标识符)是数字时代学术界的“身份证号”。
它是一串永久性的、全球唯一的字母数字代码,用于识别文档、数据集、软件或其他数字对象。与容易失效的普通网址(URL)不同,DOI 旨在解决“链接腐烂”(Link Rot)问题。即使出版商更换了网站域名、重组了服务器或文章被转移到新的数据库,只要其 DOI 保持不变,读者通过 DOI 链接(如 https://doi.org/...)永远能找到该对象的最新下载页面。它是现代学术引用和科学计量学的基石。
解剖 DOI:它长什么样?
一个 DOI 字符串由前缀(Prefix)和后缀(Suffix)两部分组成,中间用斜杠 / 分隔。
https://doi.org/10.1371/journal.pbio.0000001
| 组成部分 | 示例 | 含义 |
|---|---|---|
| 目录代码 | 10. | 固定开头,表示这是 DOI 系统中的“句柄”(Handle)。 |
| 注册者前缀 | 1371 | 代表出版商的唯一代码。例如 1371 代表 PLOS,1038 代表 Nature,1126 代表 Science。 |
| 后缀 (Suffix) | journal.pbio... | 由出版商自定义。可以是特定的刊名缩写加编号,也可以是完全随机的字符串。重要的是在系统内唯一。 |
幕后机制:为什么 DOI 不会死链?
DOI 的核心价值在于解析(Resolution)。它不是一个物理地址,而是一个指向元数据(Metadata)的指针。
- 场景: 假设 PLOS 期刊更换了网站服务器,某篇论文的 URL 从
plos.org/article1变成了journals.plos.org/new/article1。 - 普通 URL: 之前的链接会变成 404 Not Found(死链)。
- DOI 机制: 出版商只需在 DOI 注册中心(如 Crossref)更新这篇 DOI 对应的“目标 URL”。
- 结果: 用户点击 DOI 链接时,系统会查询中央数据库,然后自动跳转到最新的 URL。对于用户和引用者来说,DOI 永远不变。
关键相关概念 [Key Concepts]
1. Crossref: 全球最大的学术内容 DOI 注册机构。几乎所有的学术期刊论文(Paper)的 DOI 都是通过 Crossref 注册的。它构建了庞大的引文链接网络。
2. DataCite: 专注于研究数据(Dataset)的 DOI 注册机构。如果你在 Zenodo 或 Figshare 上传了数据,获得的 DOI 通常来自 DataCite。这让数据也变得可引用。
3. PID (持久性标识符): DOI 是 PID 的一种(针对物体)。与之对应的,人也有 PID,即 ORCID(针对研究者);机构也有 PID,即 ROR。这些 ID 共同构成了现代数字科研的基础设施。
学术参考文献 [Academic Review]
[1] Paskin N. (2010). Digital Object Identifier (DOI®) System. Encyclopedia of Library and Information Sciences.
[点评]:由 DOI 架构的首任总监撰写的权威百科条目,详细解释了 DOI 的技术架构和 Handle 系统原理。
[2] ISO 26324:2012. Information and documentation — Digital object identifier system. ISO Standard.
[点评]:DOI 的国际标准文档,确立了其语法结构和元数据规范。
[3] Bilder G, et al. (2015). Principles for Open Scholarly Infrastructures.
[点评]:讨论了包括 DOI (Crossref) 在内的基础设施必须由非营利组织管理,以保证科学记录的永久性和中立性。