Logo

上一章节 目录    下一章节: 2 编码

 

1 简介

 

© 国际数字对象标识符 (DOI) 基金会  •   中文版最后更新日期:2017年9月

 
1.1 文档概述
1.2 历史
1.3 标准
1.4 商标
1.5 简介 (ISO 26324)
1.6 概述
       1.6.1 DOI 系统概念
       1.6.2 DOI系统组件
       1.6.3 DOI 号语法
       1.6.4 DOI 号解析
       1.6.5 DOI® 数据模型
       1.6.6 DOI 系统的实现
1.7 DOI 系统的优点
 

1.1 文档概述

DOI 手册是关于 DOI® 系统信息的重要资料,DOI 号 10.1000/182 可解析到本手册的最新可用版本 。本手册中引用的部分主题论点将在相关的专题资料中进行详细阐述。

本 DOI 网站内容还包括其他的公共信息、新闻、事件和会员内部信息等。

为避免表意不清,“DOI” (用于早年的系统开发)不再作为术语单独出现,而是与一个限定成分同时使用,用于:表示 DOI 系统的特定组件(例如:“DOI 号”:在DOI 系统内指明一个唯一的参考对象的字符串);表示一个完整的系统(“DOI 系统”:DOI 号作为一种标识符应用的功能部署。即通过计算机可识别的形式,根据规范的要求进行分配、解析、参考对象描述和管理等)。

 

1.2 历史

DOI 系统源于出版业内三个行业协会(国际出版商协会,国际科学、技术和医学出版商协会,美国出版商协会)的联合倡议。尽管最早应用于文字出版,但 DOI 符合数字融合和多媒体应用的发展趋势,成为管理数字网络内容识别的通用框架,并于 1997 年在法兰克福书展上发布。同年,国际 DOI® 基金会 (IDF) 创建,旨在开发和管理 DOI 系统。

IDF 成立伊始便 与美国国家研究推进机构 (CNRI) 建立了技术合作伙伴关系,使用 CNRI 开发的 Handle system 作为 DOI 系统的数字网络组成部分。至今 CNRI 仍然是 IDF 的技术合作伙伴。

从 1998 年起该基金会与 INDECS 项目 (1998 年 - 2000 年) 密切合作,并据此发起一系列后续和持续性的项目。INDECS 框架成为了DOI 数据模型以及词汇映射框架 (VMF) 的基础。目前,IDF 负责托管 VMF 网站,并参与 VMF 管理。IDF 数据字典即为 VMF 中的一个命名空间。

2000 年,CrossRef 注册机构推出了首个 DOI 系统应用——电子文章的引文链接。此后,其他行业中也成立了注册机构,例如:娱乐业资产管理行业、数据行业和跨语言行业等。

2000 年,DOI 语法通过了 NISO 标准认证。2010 年,DOI 系统通过了 ISO 标准认证。

参考文献章节列举了讲述 DOI 第一个十年发展历程的论文。DOI 网站先前版本中的资料现已归档,发展历程报告存档供 IDF 会员查阅。

 

1.3 标准

本 DOI 手册内容完全符合相关正式标准。

DOI 系统已通过国际标准化组织认证(由 ISO 第 46 技术委员会——信息与文献技术委员会负责通过),全名为 ISO 26324,数字对象标识符系统 。该标准于 2010 年 10 月通过,并于 2012 年 5 月发布。(请参见 2012 年 5 月 10 日出版的 ISO 新闻稿。) 标准中规定了数字对象标识符系统的语法、描述和解析功能组件,以及 DOI 号(DOI 为“数字对象标识符 (digital object identifier)”的缩写)创建、注册和管理的一般原则。该标准并未规定实现该数字对象标识符系统的语法、描述和解析功能组件的具体技术。根据 ISO 26324,DOI 系统成为国际标准,将 IDF 命名为 ISO 26324 注册中心。(与其他标识符标准一样,向 DOI 系统创建一个公共标准即创建了一个注册中心的受控命名空间。与那些无需授权即可获取并遵照的技术规范不同,使用标识符必须经过授权。正如同:了解车辆牌照规范并不意味着人们可以据此制造车辆牌照;要想合法拥有车辆牌照,就必须到相关机构进行注册。)

DOI 语法为国家信息标准组织(美国)标准: ANSI / NISO Z39.84-2010 。该标准首次于 2000 年推出,2005 年经修订删除了区分大小写的内容(请参见第 2 章,"编码",“2.4 区分大小写 ”)。由于以前版本并未实施区分大小写的规范,故作此变更并无向后兼容的问题。之后,ISO 标准 26324 (2012) 纳入了语法规范。本 DOI 手册第 2 章,“5 字符集与编码” 中详细阐述了 NISO 标准中关于语法编码的内容。IOS 标准同时包含了详细的可扩展元数据方案,尽管这些方案不属于 ISO 标准的一部分,该 IOS 标准确保其持久有效。

DOI 是一个 info-URI 命名空间(IETF RFC 4452,公共命名空间标识符中标识信息资产的“info” URI 方案)中的注册 URI。DOI 号也可以通过 http: proxy server 使用 URL (URI) 进行表示。

DOI 系统使用 Handle System (IETF RFC 3650, 3651, 3652)。

Norman Paskin曾撰文阐述DOI标准化的历史/案例研究,“数字对象标识:从专用标准到国家标准再到国际标准”,包含在《关键部件:信息交换环境中的标准(2015)》一书中(ISBN13: 978-0-8389-8744-5),由Todd Carpenter编辑、ALCTS(美国图书馆学会出版社)出版。该书的PDF版(ISBN: 978-0-8389-8745-2)和EPUB版(ISBN: 978-0-8389-8746-9)的套装也可以在ALA书店上在线获取。

 

1.4 商标

DOI®,DOI.ORG® 和 shortDOI® 为国际 DOI® 基金会注册商标。正确执行国际标准 ISO 26324 的用户将获得IDF 的授权,免费使用上述商标,但仅表示其正确执行该标准,并无他用。对于根据 ISO 26324 开发软件和其他产品及服务的用户,倘若满足如下要求,IDF 乐意授权其免费使用 DOI 商标:

符合上述情形的公司、机构和出版社,可以点击此处下载 DOI 标志,调整尺寸后即可在互联网上使用。使用该图标并不意味着 IDF 对该公司、产品或服务的认可和推荐。

身份指南和图标精选供会员机构使用。

 

1.5 ISO 26324 简介

以下简介内容摘自 ISO 26324。

数字对象标识符[DOI®]系统为任意类型对象的提供持久唯一的标识。

DOI 全称为“数字对象标识符 (digital object identifier)”,意为“一个对象的数字标识符”,而非“一个数字对象的标识符”。DOI 系统由国际数字对象标识符 (DOI) 基金会创建于 1998 年,最初由 ISO/TC46/SC9 中的一些成员共同合作开发。鉴于其在信息与文献领域的应用以及之前与 ISO/TC46/SC9 成员的合作,该系统于 2004 年纳入工作项目,于 2006 - 2010 年得到进一步开发。

DOI 系统的设计面向互联网工作环境。DOI 号永久性地分配给一个对象,为该对象的当前信息提供可解析的持久性网络链接,这些当前信息包括该对象在互联网上的位置和资料等。尽管一个对象的信息可以不断改变,但其 DOI 号保持不变。一个 DOI 号可在 DOI 系统中解析为一种或多种与该 DOI 号所标识的对象相关的值,例如:URL、电子邮箱地址、其他标识符和描述性元数据。

DOI 系统可以实现自动化服务和事务处理。DOI 系统的应用包括(但不仅限于):管理信息与文献地址与权限、管理元数据、便于电子化事务处理、实现任何格式任何数据的持久性唯一标识,以及商业与非商业事务处理。

基于结构化的可扩展数据模型(此类模型可使对象与要求的任意精度和粒度的元数据相关联),与 DOI 号相关联对象的内容使用 DOI 元数据进行明确地描述。该数据模型支持 DOI 应用之间的互操作性。

DOI 系统的范围不根据所指对象的内容种类(如格式等)进行定义,而是参照其功能实现和使用环境进行定义。在 DOI 应用网络环境中,DOI 系统提供了唯一标识、持久性、解析、元数据和语义互通。

 

1.6 概述

本概述简要介绍 DOI 系统。要了解 DOI 系统各方面的详细信息,请参阅本手册的相关章节。亦请参阅专题资料“数字对象标识符系统的主要特征”。

数字对象标识符 (DOI) 构想了数字融合和多媒体可用性的发展趋势,成为管理数字网络内容识别的通用框架。其重要特征包括持久性、网络访问、与其它标识符的互操作性、共享的容错架构,以及对不同格式标识符的解析能力。DOI 符合 ISO 26324 标准。

DOI 系统通过注册机构得以实现,这些注册机构使用底层 DOI 框架体系,为各类应用提供指定域的标识符。例如,CrossRef 管理科技出版业的 DOI;DataCite 提供 用于参考和分享科学数据集的 DOI;娱乐业标识注册 (EIDR) 提供商业电影与视频产业中使用的标识符和相关联的元数据,涵盖后期制作、广播、数字发行和报道。

由于 DOI 系统面向网络工作并具有互操作性,故而使用 DOI 可以轻而易举地满足各种现代化应用的要求。例如:各行业使用 DOI 系统完成其内部流程;使用 DOI 系统进行跨公司或跨国的发行与报道;DOI 系统也在新兴的语义网络领域得到广泛应用。

 

1.6.1 DOI 系统概念

DOI 全称为“数字对象标识符 (digital object identifier)”,意为“一个对象的数字标识符”。一个 DOI 号是一个实体在数字网络上的标识符(不是位置)。该系统在数字网络中提供了持久实用的标识,以及被管理信息的互操作性交换。DOI 号可以分配给物质、数字或抽象的任意实体,主要用于相关用户社区的分享或知识产权的管理。DOI 系统的设计面向互操作性,充分发挥已有标识符与元数据方案的作用。DOI 号也可以通过 URL (URI) 进行表示。

DOI 系统于 1998 年由国际数字对象标识符 (DOI) 基金会(由若干出版行业协会发起的非营利性会员机构)创建,之后通过 ISO 26324 标准认证。要享有 DOI 注册机构提供的服务,用户可以向该机构注册,亦或通过发展社区来创建服务。现有 DOI 号均可免费解析。注册新 DOI 号的费用取决于其使用 DOI 的服务,该 DOI 由注册机构提供。每个注册机构均免费提供符合整体 DOI 政策的商业模型。个体注册机构针对其社区和应用采纳相应的规则。

随着全球范围内注册机构联盟数量的不断增长,已为数据分配了数以百万计的 DOI 号。例如:3,800 家出版社使用 CrossRef 应用以实现学术出版物上的交叉引用;DataCite 国际数据中心联盟使用 DOI 系统;娱乐业标识注册将 DOI 号应用于电影和广播资产。

DOI 系统使用 Handle System®(一个通用的全球编号服务,能够通过互联网实现安全的编号解析)和 indecs 框架体系(一个通用的基于本体的语境数据模型结构)。

在数字环境下,唯一标识符(编号)对于信息管理尤为重要。某一环境下分配的标识符,可能在其他地点(或时间)遇到或重复使用,因此在未咨询分配者的情况下,使用者无法了解其分配时的环境。标识符的持久性可以认为是该理念的一种延伸,即:与未来的互操作性。更进一步说明,既然分配者直接控制以外的服务是任意定义的,那么互操作性就意味着要求扩展性。因此,DOI 系统是适用于所有数字对象的的通用框架,为标识、描述和解析提供了结构化的、可扩展的方法。分配给 DOI 号的实体可以是任何逻辑实体。

 

1.6.2 DOI 系统组件

DOI 系统封装了若干组件,可根据需要直接调用。包括:

 

1.6.3 DOI 号语法

DOI 号语法规定了包含命名机构和命名代表的模糊字符串的构成。它提供了一个标识符的“容器”,适用于所有现有的标识符。DOI 号由两部分组成:前缀和后缀。两者共同组成 DOI 号,其间使用“/”分隔。后缀是“/”分隔符后面的部分,可以是一个已有的标识符,也可以是注册者选用的任意唯一字符串。前缀是“/”分隔符前面的部分,表示唯一的命名机构。DOI 号无长度限制。

DOI 号可以指定给任何实体,必须根据结构化的元数据作精确定义。即使所有权发生了变化,DOI 号一经分配,持久不变。

前缀分配给希望注册 DOI 号的机构,任何组织都可以选择多个前缀。前缀之后(由斜线分隔)是后缀(对于特定的前缀是唯一的),用于标识实体。DOI 号中前缀表示注册者,后缀由该注册者提供并且唯一。这样的构成避免了 DOI 号的集中分配。

DOI 号中可能包含已有的标准标识系统号(如 ISBN),作为后缀使用。如果注册者需要使用此类标号,则必须确保同样的实体在不同的系统中分别进行了的标注。

若需更多信息,请参阅第 2 章 “编码”。

 

1.6.4 DOI 号解析

解析是指向网络服务输入(请求)一个标识符,并返回一条或多条与该被标识实体(例如:该对象所处的位置,如 URL)相关的当前信息(状态数据)的过程。解析在某种程度上是一个标识符与其输出之间的一种间接管理。在数字网络中,解析组件允许从 DOI 号重定位到其关联数据。最初应用面向单一位置(URL)解析,以保证其持久性(即使更改了 URL,DOI 号仍然可以正常使用并重定位到新的位置。) 然而,更加有用的是对多重关联数据(如多重位置、多重元数据、多重共同服务)或可扩展分配者定义数据进行解析。DOI 系统使用 Handle System 作为解析工具。该系统具有其他机制所不具备的优势,包括全局可扩展性、完整 Unicode 编码支持和高安全性。

DOI 系统中 Handle System 的实现通过扩展的技术架构和 DOI 系统特有的应用功能进行补充。Handle System 没用预设定义表达关系框架体系的限制。DOI 系统是 Handle System 的一个应用,通过设定限制以实现其内容管理的特定目的。DOI 系统中,使用语义上的互用数据字典定义限制。

若需更多信息,请参阅第 3 章 “解析”。

 

1.6.5 DOI® 数据模型

DOI 系统数据模型由一个数据字典和应用该词典的框架体系构成。两者共同定义 DOI 号规定的内容(通过使用数据字典)和 DOI 号之间的相互关系。这就实现了语义的互操作性,使得某一语境中的信息能够最大程度自动化地在另一语境中进行使用。

DOI 系统使用由底层本体创建的互操作数据字典。数据字典组件旨在确保现有元数据元素集最大程度上的互操作性,字典中的术语以有意义的方式进行分组,可以通过关联特定的服务,管理应用中某些类型的 DOI 号。这就提供了整合 handle 解析功能与结构化数据方法的手段。在该数据模型中,DOI 号无需进行扩展使用,但也考虑到其可能的扩展性。

本体逻辑数据模型具有一致性和逻辑性的特点,与传统的知识表达分类方法不同,传统的方法不遵循严格的父类/子类层级结构。术语可以继承多个父类的意义,并可维持较为复杂的关系。一个互用数据字典包含来自不同计算机系统或元数据方案的术语,并以一种特定的方式显示其间的关系。IDF 在应用此方法上面付诸了许多努力,特别是链接内容联盟词表映射框架 。词表映射框架将现有的 RDA/ONIX 框架扩展为一个综合的资源关系词和分类词表,它们形成的超集成为发行商/制作人、教育和书目/文物社区(CIDOC CRM、DCMI、DDEX、DOI、FRBR、MARC21、LOM、ONIX 和 RDA)遵循的主要标准。

若需更多信息,请参阅第 4 章 “数据模型”。

 

1.6.6 DOI 系统的实现

DOI 系统由注册机构联盟实施,该联盟使用其上级机构——国际数字对象标识符 (DOI) 基金会 (IDF) ——制定的政策和开发的工具。IDF 是 DOI 系统的管理机构,保护(代表注册人拥有或许可)与 DOI 系统相关的所有知识产权。IDF 与 RA 协作,使用 DOI 系统组件的底层技术标准,以确保对该系统(包括创建、维护、注册、解析和 DOI 号的决策)所做的任何改进都提供给所有的 DOI 号注册者,同时确保无需任何第三方许可即可实施 DOI 号标准。用户可以免费解析所有的 DOI 号。

DOI 系统灵活性强,可提供标识和解析服务,以满足所有应用领域的需求。这种灵活性很有必要,因为有些用户需要建立特定的社会和技术结构,以支持某个社区内的特殊需求(如科学数据)。对于标识哪些内容以及被标识的两种内容是否相同的规则,由注册机构根据 DOI 号的特定应用来制定。这样的标识系统灵活性高、功能强大,同时突显了显性结构化元数据层的重要性。从本质上讲,如果没有这种特点,标识符在特定的应用之外将不具备任何意义。

IDF 通过商定管理、范围和政策方面的标准,来确定行业规则。它还提供了一套技术架构(解析机制、代理服务器、镜像、备份、中央字典)和一套社会基础模式(持久性承诺、回滚程序、自主模型上的成本回收),以及该系统的共享使用。IDF 不是一个标准化机构,而是一个中央认证和维护机构。该系统通过了 ISO 26324 标准认证。ISO 指定 IDF 为该标准的 ISO 注册中心。IDF 通过注册机构代表并授权使用该系统。各注册机构均可开发自己的应用,并在其社区中以“自有商标”的方式使用 DOI 系统。

 

1.7 DOI 系统的优势

DOI 系统具有一系列独特的功能:

DOI 系统拥有众多优点,包括便于内部内容管理和实现更快、更具扩展性的产品开发。以下四大关键优势使其更加宜用,价格更加低廉:

在过去的十年中,发表了一系列报告,大量列举或赞赏了 DOI 的优势,并讨论了网络环境下持久性标识符的必要性。单击此处可以查看精选归档内容。除此之外,IDF 会员还可以查阅热门文献

 

上一章节: 目录    下一章节:: 2 编码

 
DOI_disc_logo ®,DOI® ,DOI.ORG® 和 shortDOI® 为国际 DOI 基金会商标。