Atom/RSS feed

ARK Alliance

Home of the Archival Resource Key (ARK)

đŸ‡«đŸ‡· FAQ sur les identifiants ARK

Les bases

Comment puis-je donner mon avis sur ce document ?

En envoyant un e-mail Ă  la liste de diffusion ARK ou en nous contactant ici.

Que sont les ARK ?

Les ARK (Archival Resource Key) sont des identifiants de haute performance qui vous donnent accĂšs Ă  des choses et Ă  des descriptions de ces choses. Par exemple, cet ARK,

    https://n2t.net/ark:/67531/metadc107835/

vous donne accùs à une thùse, et, en ajoutant ‘??’ à la fin de l’ARK, devrait vous amener à sa description :

    https://n2t.net/ark:/67531/metadc107835/??

Qu’est-ce qu’un identifiant ?

Sur Internet, un identifiant est une URL, ou une partie d’URL. Par exemple, cet identifiant ARK principal,

         ark:/12148/btv1b8449691v/f29

figure dans deux URL (Uniform Resource Locators, également appelés « liens Web » ou « adresses Web ») différentes :

  http://ark.bnf.fr/ark:/12148/btv1b8449691v/f29

  https://n2t.net/ark:/12148/btv1b8449691v/f29

Les ARK sont plus particuliĂšrement destinĂ©s Ă  ĂȘtre des identifiants pĂ©rennes.

Qu’est-ce qu’un « identifiant pĂ©renne » ?

On a estimĂ© que la durĂ©e de vie moyenne d’un URL Ă©tait de 44 jours. La fin de la vie d’un URL advient lorsque celui-ci se « rompt » ; il vous retourne alors la redoutable erreur “404 Introuvable” que la plupart d’entre nous connaissent bien. Non seulement c’est agaçant, mais c’est en outre politiquement embarrassant lorsque l’on recherche des publications scientifiques financĂ©es sur fonds publics, et c’est un dĂ©sastre culturel pour les bibliothĂšques, les archives, les musĂ©es et autres institutions mĂ©morielles.

Parmi les multiples liens qui peuvent ou ont pu vous conduire Ă  une chose, un identifiant pĂ©renne est un lien qui, en principe, continue de fonctionner trĂšs longtemps. Les services qui permettent la dĂ©couverte et l’interconnexion de ressources (comme entre les articles universitaires, les auteurs, les donnĂ©es de la recherche et les sujets connexes) prĂ©fĂšrent les identifiants pĂ©rennes en raison de cette stabilitĂ©.

Les identifiants pĂ©rennes devraient continuer Ă  fonctionner mĂȘme lorsque les choses sont dĂ©placĂ©es d’un site Web Ă  un autre. Normalement, lorsque les choses sont dĂ©placĂ©es, tous ceux qui ont dĂ©jĂ  enregistrĂ© les anciens liens devraient ĂȘtre informĂ©s des nouveaux, ce qui est presque impossible. C’est alors qu’interviennent les rĂ©solveurs d’identifiants.

Qu’est-ce qu’un rĂ©solveur ?

Un rĂ©solveur est un site Web spĂ©cialisĂ© dans la rĂ©orientation d’identifiants entrants (ceux initialement annoncĂ©s aux utilisateurs) vers les sites Web actuellement les mieux Ă  mĂȘme de les traiter. Ce transfert est gĂ©nĂ©ralement appelĂ© « rĂ©solution » et une des Ă©tapes de ce processus de rĂ©solution la « redirection ».

Pour qu’un rĂ©solveur fonctionne, son nom d’hĂŽte - hostname en anglais - (« n2t.net » ou « ark.bnf.fr » dans les identifiants ci-dessus) doit ĂȘtre soigneusement choisi afin qu’il ne soit plus nĂ©cessaire de le changer. Les noms d’hĂŽte des institutions mĂ©morielles, dont certaines sont vieilles de plusieurs siĂšcles, sont souvent de bons candidats pour devenir des rĂ©solveurs. On citera d’autres rĂ©solveurs, plus rĂ©cents et plus connus : n2t.net (le rĂ©solveur ARK), identifiers.org, doi.org, handle.net et purl.org.

À quoi peut-on attribuer un ARK ?

À toute chose numĂ©rique, physique ou abstraite. Cela inclut les choses qui n’existent pas encore mais auxquelles vous devez faire rĂ©fĂ©rence depuis des objets que vous crĂ©ez ou prĂ©voyez de crĂ©er, comme un lien depuis le brouillon d’un article vers un jeu de donnĂ©es en prĂ©paration, ou un lien depuis une lettre numĂ©rique archivĂ©e vers un instrument de recherche Ă  crĂ©er. Attention, vous ne devriez attribuer des ARK qu’à des choses que vous possĂ©dez, contrĂŽlez ou gĂ©rez. Attribuer des ARK Ă  des choses que vous ne contrĂŽlez pas est dĂ©conseillĂ© car de tels identifiants sont gĂ©nĂ©ralement fragiles.

Vous trouverez ci-dessous une liste de choses qui reçoivent des ARK. Les nombres sont une estimation produite en septembre 2019 par les organisations elles-mĂȘmes.

Qui utilise les ARK ?

Difficile Ă  dire car les ARK sont dĂ©centralisĂ©s, mais plus de 600 organisations enregistrĂ©es ont créé, selon leurs estimations, environ 3,2 milliards d’ARK. Vous trouverez des ARK utilisĂ©s comme permaliens dans

Voici la rĂ©partition globale des organisations enregistrĂ©es comme attributrices d’ARK en avril 2020. Cliquez sur l’image ci-dessous pour accĂ©der Ă  une carte Ă  jour et zoomable.

Pour commencer

De quoi ai-je besoin pour créer des ARK ?

Tout d’abord, vous avez besoin d’un NAAN (numĂ©ro d’autoritĂ© nommante, ou Name Assigning Authority Number en anglais), qui est un numĂ©ro exclusivement rĂ©servĂ© Ă  votre organisation. Il doit apparaĂźtre dans chaque ARK attribuĂ© par votre organisation, juste aprĂšs l’étiquette “ark:/”. Le NAAN de tous ces ARK

                     ark:/12148/btv1b8449691v/f29

   http://ark.bnf.fr/ark:/12148/btv1b8449691v/f29

     https://n2t.net/ark:/12148/btv1b8449691v/f29

est 12148 ; il identifie de maniĂšre unique la BibliothĂšque nationale de France. Chaque NAAN est associĂ© Ă  l’URL d’un rĂ©solveur pour ses ARK. Par exemple, pour rĂ©soudre un ARK en 12148, apposez-le aprĂšs http://ark.bnf.fr/ comme indiquĂ© ci-dessus. Le rĂ©solveur N2T.net est Ă  part dans la mesure oĂč il transmet tout ARK au rĂ©solveur associĂ© Ă  son NAAN.

L’obtention ou l’utilisation d’un NAAN est gratuite et vous pouvez en demander un en remplissant un formulaire en ligne. Plus de 650 organisations (bibliothĂšques, archives, musĂ©es, facultĂ©s, agences gouvernementales, Ă©diteurs scientifiques et pĂ©dagogiques, projets, etc.) ont un NAAN rĂ©pertoriĂ© dans le registre public NAAN.

Comment commencer à créer des chaßnes de caractÚres destinées à devenir des ARK ?

Vous ĂȘtes libre de crĂ©er des chaĂźnes de caractĂšre ARK Ă  votre guise, Ă  condition que vous n’utilisiez que des chiffres, des lettres (ASCII, donc sans aucun signe diacritique) et les caractĂšres suivants :

    = ~ * + @ _ $ . /

Les deux derniers caractĂšres sont rĂ©servĂ©s pour le cas oĂč vous souhaiteriez divulguer des relations entre ARK.

Une autre des caractĂ©ristiques des ARK est que les traits d’union (‘-‘) peuvent ĂȘtre utilisĂ©s mais qu’ils sont inertes en ce qui concerne l’identitĂ©, ce qui signifie que des chaĂźnes ne diffĂ©rant que par des traits d’union sont considĂ©rĂ©es comme identiques ; par exemple, ces chaĂźnes

  ark:/12345/141e86dc-d396-4e59-bbc2-4c3bf5326152

  ark:/12345/141e86dcd3964e59bbc24c3bf5326152

identifient la mĂȘme chose. La raison de cette fonctionnalitĂ© est que les processus de formatage de texte utilisĂ©s Ă  travers le monde introduisent rĂ©guliĂšrement des traits d’union supplĂ©mentaires dans les identifiants, rompant ainsi les liens avec tout serveur qui considĂšre les traits d’union comme signifiants.

Les ARK distinguent majuscules et minuscules, ce qui permet des identifiants plus courts (52 contre 26 lettres par caractĂšre). La « mĂ©thode ARK » consiste toutefois Ă  n’utiliser que des minuscules, sauf si vous avez besoin d’ARK plus courts. Cette restriction facilite la prise en charge de vos ARK par les rĂ©solveurs s’ils sont reçus avec des majuscules ou des majuscules et minuscules mĂ©langĂ©es, ce qui arrive malheureusement souvent Ă  cause de l’idĂ©e, vieille de 50 ans, selon laquelle les identifiants sont insensibles Ă  la casse. Vous pouvez Ă©galement envisager d’utiliser le rĂ©pertoire de caractĂšres de l’outil Noid, qui crĂ©e des chaĂźnes protĂ©gĂ©es contre une retranscription fautive Ă  l’aide de l’algorithme de contrĂŽle le plus puissant. Ce rĂ©pertoire comprend uniquement des chiffres et des consonnes moins ‘l’ (lettre « L », souvent confondue avec le chiffre 1) :

  bcdfghjkmnpqrstvwxz0123456789

Pour l’attribution, une stratĂ©gie courante consiste Ă  tirer parti des identifiants hĂ©ritĂ©s. Par exemple, un numĂ©ro de spĂ©cimen de papillon de musĂ©e, cd456f9_87, pourrait ĂȘtre publiĂ© sous l’ARK ark:/12345/cd456f9_87. Certains identifiants hĂ©ritĂ©s devront peut-ĂȘtre ĂȘtre modifiĂ©s compte tenu des restrictions de caractĂšres ARK. La deuxiĂšme stratĂ©gie couramment utilisĂ©e consiste Ă  crĂ©er des chaĂźnes entiĂšrement nouvelles pour vos ARK. Dans ce cas, il est important de considĂ©rer si elles doivent ĂȘtre totalement ou partiellement opaques, ou signifiantes.

Que sont les identifiants opaques ?

Les chaĂźnes de caractĂšres d’identifiants pĂ©rennes sont gĂ©nĂ©ralement opaques et rĂ©vĂšlent dĂ©libĂ©rĂ©ment peu de choses sur ce Ă  quoi elles sont attribuĂ©es, car les identifiants non opaques ne vieillissent pas ou ne voyagent pas bien. Les noms d’organisations sont connus pour ĂȘtre transitoires, raison pour laquelle les NAAN sont des nombres opaques. Lorsque les dates et les titres sont corrigĂ©s, que les significations des mots Ă©voluent (par exemple, d’anciens sigles innocents peuvent devenir offensants ou attentatoires), les chaĂźnes de caractĂšres censĂ©es ĂȘtre pĂ©rennes peuvent gĂ©nĂ©rer de la confusion ou poser un problĂšme politique. La gĂ©nĂ©ration et l’attribution de chaĂźnes de caractĂšres complĂštement opaques comportent Ă©galement des risques ; ainsi, des nombres attribuĂ©s sĂ©quentiellement rĂ©vĂšlent des informations sur leur date et les chaĂźnes de caractĂšres contenant des lettres peuvent gĂ©nĂ©rer fortuitement des mots (c’est pourquoi le rĂ©pertoire de caractĂšres recommandĂ© ne comporte pas de voyelles).

Exemples de chaĂźnes de caractĂšres plus ou moins opaques

non-opaque Netscape Permanent Archive Gay_Divorcee_1934_April_1 Name-to-Thing Resolver
opaque-ish x0001, x0002, 
, x9998 GD/1934/04/01 n2t.net
opaquer 141e86dc-d396-4e59-bbc2-4c3bf5326152 19340401 n2t
opaquest 141e86dcd3964e59bbc24c3bf5326152 h8k74926g 12148

Il n’est pas obligatoire que les ARK soient opaques, mais il est recommandĂ© que le nom de base de l’objet le soit, car il constitue en gĂ©nĂ©ral le nom du sujet principal de l’effort de pĂ©rennisation. Si des qualificatifs suivent ce nom, il est moins important qu’ils soient opaques. Pour vous aider Ă  dĂ©terminer votre niveau d’opacitĂ©, vous pouvez Ă©valuer la compatibilitĂ© avec les identifiants hĂ©ritĂ©s et la facilitĂ© de gĂ©nĂ©ration et de retranscription de la chaĂźne de caractĂšres (en prenant en compte la compacitĂ©, le caractĂšre de contrĂŽle). De nouvelles chaĂźnes de caractĂšres peuvent ĂȘtre gĂ©nĂ©rĂ©es avec la date et l’heure, un UUID, Ă  l’aide d’un gĂ©nĂ©rateur de nombres ou du gĂ©nĂ©rateur Noid (Nice Opaque Identifiers).

Les chaĂźnes de caractĂšres opaques sont « muettes » et donc difficiles Ă  gĂ©rer, c’est pourquoi les ARK ont Ă©tĂ© conçus pour ĂȘtre des identifiants « parlants ». Cela signifie que s’il existe des mĂ©tadonnĂ©es sur la ressource, un ARK qui se prĂ©sente sur votre serveur suivi de l’inflexion « ? » devrait pouvoir parler de lui-mĂȘme.

Comment rendre le contenu du serveur accessible via les ARK ?

Tout d’abord, dĂ©terminez ce que sera l’expĂ©rience utilisateur lors de l’accĂšs par vos ARK : une feuille de calcul, un PDF, une image, une page d’accueil affichant des mĂ©tadonnĂ©es et plusieurs options ? Quel que soit votre choix, prĂ©voyez que votre serveur retourne des mĂ©tadonnĂ©es si l’ARK arrivait suivi d’une inflexion « ? ».

Pour le reste, rĂ©soudre des ARK revient Ă  rĂ©pondre Ă  des URL. Normalement, les URL entrants appellent (ou sont associĂ©s Ă ) du contenu renvoyĂ© par votre serveur Web. Si votre serveur est compatible ARK, les ARK entrants (exprimĂ©s sous forme d’URL) doivent ĂȘtre associĂ©s au mĂȘme contenu. L’approche habituelle consiste Ă  associer l’ARK Ă  l’URL Ă  l’aide d’une table de donnĂ©es que vous mettez Ă  jour chaque fois que l’URL change. Dans ce cas, votre serveur agit comme un rĂ©solveur local. Si vous ne souhaitez pas l’implĂ©menter vous-mĂȘme, il existe des outils et services logiciels ARK qui peuvent vous aider.

Une autre approche consiste Ă  laisser votre serveur Web fonctionner en l’état et, au lieu de mettre Ă  jour ses tables locales, de maintenir des tables de correspondance ARK/URL sur un rĂ©solveur distinct. Cette approche est adoptĂ©e par nombre d’éditeurs de logiciels et par les organisations maintenant leurs tables via le service EZID (qui est liĂ© au rĂ©solveur n2t.net et met Ă  jour les tables de rĂ©solution de ce dernier).

Comment citer ou faire connaĂźtre un ARK ?

On prĂ©fĂ©rera la forme URL (https ou http) de l’ARK. Par exemple : https://n2t.net/ark:/99166/w66d60p2. Un ARK destinĂ© Ă  un usage externe est gĂ©nĂ©ralement publiĂ© (annoncĂ©, diffusé ) de cette maniĂšre afin de constituer un identifiant actionnable. Si un affichage visuel plus compact est nĂ©cessaire, il doit ĂȘtre associĂ© Ă  un lien hypertexte. Par exemple :

<a href="https://n2t.net/ark:/99166/w66d60p2">ark:/99166/w66d60p2</a>

Une dĂ©cision importante consiste Ă  dĂ©terminer si vos URI ARK utiliseront le nom d’hĂŽte de votre rĂ©solveur local ou le rĂ©solveur N2T.net. Si vous privilĂ©giez le contrĂŽle ou la stratĂ©gie de marque, vous prĂ©fĂ©rerez publier des ARK utilisant votre rĂ©solveur local. Si vous doutez de la stabilitĂ© de votre nom d’hĂŽte local, vous prĂ©fĂ©rerez publier vos ARK en utilisant le nom d’hĂŽte n2t.net (voir ici des exemples des deux approches).

Quelle que soit la maniÚre dont vous les publiez, la résolution de vos ARK via N2T est toujours possible.

Existe-t-il des outils et des services de gestion d’ARK ?

Voici une liste partielle d’outils logiciels de gestion d’identifiants. Elle comprend notamment

On y mentionne également certains éditeurs de logiciels et fournisseurs de service, tels que EZID. Vous trouverez ici des informations supplémentaires sur les concepts et les bonnes pratiques.

« ARK » est-il une métaphore chrétienne ?

Non, l’identifiant ARK n’est pas une mĂ©taphore chrĂ©tienne. « ARK » a Ă©tĂ© choisi principalement comme acronyme prononçable pour « Archival Resource Key ».

Notre logo et notre acronyme Ă©voquent peut-ĂȘtre l’histoire de l’Arche de NoĂ©, commune aux religions abrahamiques de l’islam, du judaĂŻsme et du christianisme. Nous serions ravis que l’identifiant ARK soit associĂ© Ă  un rĂ©cipient fiable pour prĂ©server des objets prĂ©cieux.

Pour aller plus loin

Qu’est-ce que N2T ?

N2T.net est un rĂ©solveur ARK global. N2T, qui signifie « Nom-Ă -Objet », est en rĂ©alitĂ© un rĂ©solveur gĂ©nĂ©ralisĂ© permettant de mapper des noms Ă  des objets. Il sait donc oĂč acheminer plus de 900 autres types d’identifiants : ARK, DOI, PMID, Taxon, PDB, ISSN, etc. Si cela vous intĂ©resse, le schĂ©ma et la rĂ©ponse suivante fournissent plus de dĂ©tails.

La rĂ©solution commence lorsqu’un utilisateur tente d’accĂ©der Ă  une URL (par exemple, en cliquant sur un lien) composĂ©e de « https://n2t.net/ » suivi de l’identifiant (nom) Ă  rĂ©soudre. Comme pour tout rĂ©solveur, personne ne sait Ă  l’avance – ni l’utilisateur, ni le navigateur web, ni N2T lui-mĂȘme – si la rĂ©solution rĂ©ussira. Cela dĂ©pend des informations que N2T obtient sur l’identifiant reçu.

Une fois la rĂ©solution terminĂ©e, l’utilisateur ne s’en rend souvent pas compte, Ă  moins d’y prĂȘter attention (par exemple, il remarque que le lien dans la barre d’adresse est diffĂ©rent de celui sur lequel il a cliquĂ©). La rĂ©solution est conçue pour se produire sans que l’utilisateur ne s’en aperçoive.

Comment fonctionne N2T ?

Structure du résolveur N2T

Lorsqu’une demande de rĂ©solution provient du grand public, N2T recherche l’identifiant et redirige le lien d’origine vers un lien de transfert. Pour ce faire, il utilise deux « modĂšles » de rĂ©solution diffĂ©rents. Pour commencer, N2T tente de rĂ©soudre le problĂšme en fonction des informations contenues dans un identifiant individuel stockĂ©. À dĂ©faut, il tente de rĂ©soudre le problĂšme selon les rĂšgles de classe stockĂ©es, en fonction du type d’identifiant.

N2T stocke un type de donnĂ©es diffĂ©rent pour chaque modĂšle. Il stocke d’abord les enregistrements individuels d’environ 50 millions d’identifiants d’objet (par exemple, ARK, DOI) obtenus auprĂšs de trois sources : EZID.cdlib.org, Internet Archive et YAMZ.net. Lorsque ces enregistrements incluent une URL de redirection (target) et des mĂ©tadonnĂ©es descriptives, N2T peut agir sur les inflexions, ainsi qu’effectuer le suffix passthrough et la « nĂ©gociation de contenu ». Pour prendre en charge la crĂ©ation et la maintenance d’enregistrements d’identifiants individuels, une API N2T nĂ©cessite des identifiants de connexion. L’API permet Ă©galement des opĂ©rations par lots et la gĂ©nĂ©ration d’identifiants uniques.

DeuxiĂšmement, mĂȘme si N2T ne connaĂźt rien d’un identifiant individuel, la rĂ©solution peut fonctionner grĂące Ă  un enregistrement de rĂšgle de routage stockĂ© et dĂ©clenchĂ© par le type d’identifiant. N2T conserve plus de 3 500 enregistrements de rĂšgles rĂ©guliĂšrement mis Ă  jour Ă  partir de plusieurs sources, notamment le registre NAAN, une base de donnĂ©es d’épaules ARK et DOI et un partenariat formel sur les identifiants compacts avec identifiers.org.

Si la plupart des ARK ont leur propre résolveur, pourquoi existe-t-il également un résolveur global pour les ARK ?

La plupart des ARK sont créés par des organisations qui les publient en utilisant leur propre résolveur. Par exemple, cet ARK a été publié en spécifiant le résolveur ark.bnf.fr :

  http://ark.bnf.fr/ark:/12148/btv1b8449691v/f29

Avoir Ă  gĂ©rer et Ă  maintenir son propre rĂ©solveur est la contrepartie d’une autonomie complĂšte. L’utilisation de votre propre rĂ©solveur vous permet Ă©galement de mettre en avant votre « marque » via le nom d’hĂŽte, l’inconvĂ©nient Ă©tant que les marques sont transitoires et ont tendance Ă  fragiliser les identifiants. Les pressions politiques voire lĂ©gales (par exemple, sur les marques commerciales) peuvent rendre difficile le maintien de noms d’hĂŽtes de « marque » plus anciens, et donc des identifiants sur lesquels ils ont Ă©tĂ© construits. C’est un autre argument en faveur du rĂ©solveur ARK global. Les utilisateurs rencontrant ultĂ©rieurement un identifiant brisĂ© et constatant que son nom d’hĂŽte n’existe plus peuvent, si c’est un ARK, extraire son identitĂ© immuable de base (l’élĂ©ment commençant par « ark: ») et la prĂ©senter au rĂ©solveur global n2t.net,

  https://n2t.net/ark:/12148/btv1b8449691v/f29

Mon organisation a son propre résolveur ARK - dois-je me soucier de N2T.net ?

Oui, et ce pour deux raisons principales. Tout d’abord, si vos ARK « Ă  l’état sauvage » apparaissent sans votre le nom d’hĂŽte de votre rĂ©solveur (c’est-Ă -dire, s’ils commencent par « ark: 
 », ce qui n’est pas rare), la personne qui veut les utiliser n’est pas tenue de connaĂźtre le nom d’hĂŽte : il lui suffit d’ajouter « n2t.net » devant eux. Cela fonctionne car N2T connaĂźt le nom d’hĂŽte du rĂ©solveur.

DeuxiĂšmement, si certaines organisations et leurs noms d’hĂŽtes rĂ©solveurs ont une longue durĂ©e de vie, la plupart ne durent pas. Une personne essayant d’utiliser un ARK contenant un nom d’hĂŽte de rĂ©solveur non fonctionnel peut remplacer la partie non fonctionnelle par « n2t.net ». Si les circonstances vous obligent Ă  changer votre rĂ©solveur, cette Ă©tape de remplacement donne aux ARK que vous avez publiĂ©s avant le changement une meilleure chance de fonctionner.

Pour Ă©viter de futurs dĂ©sagrĂ©ments, certaines organisations qui gĂšrent leurs propres rĂ©solveurs peuvent choisir d’emblĂ©e de prĂ©fĂ©rer au nom de leur rĂ©solveur le nom de domaine n2t.net pour la publication de leurs ARK.

Pourquoi le résolveur ARK global (n2t.net) ne contient-il pas le mot « ARK » ?

Lorsque le besoin d’un rĂ©solveur ARK global est apparu, les principes de base d’ouverture et de gĂ©nĂ©ricitĂ© ont dissuadĂ© les concepteurs de crĂ©er un autre silo sur le modĂšle de DOI / Handle / PURL. Au lieu de quoi, le rĂ©solveur ARK a Ă©tĂ© conçu pour ĂȘtre un rĂ©solveur gĂ©nĂ©rique, non liĂ© Ă  un format, appelĂ© N2T (Name-to-Thing), qui rĂ©sout maintenant plus de 600 types d’identifiants, y compris les ARK, les DOI, les Handle, les PURL, les URN, les ORCID, les ISSN, etc. La rĂ©solution consiste Ă  rechercher dans une table une chaĂźne de caractĂšres d’identifiant, quel que soit son type, et Ă  la rediriger au bon endroit.

Les mĂȘmes principes de base ont guidĂ© la conception d’un outil antĂ©rieur appelĂ© noid, conçu pour les ARK, mais Ă©galement utilisĂ© rĂ©guliĂšrement par les organisations attribuant des Handle.

Que désigne-t-on par « transfert de suffixe » ?

En bref, le transfert de suffixe est une fonctionnalitĂ© de N2T. Supposons que vous n’ayez qu’un seul ARK enregistrĂ©, https://n2t.net/ark:/12345/6789, et qu’il redirige vers la page du serveur Web,

  https://a.example.org/dataset542

Et supposons que ce mĂȘme serveur serve Ă©galement ces pages :

  https://a.example.org/dataset542/volume3
  https://a.example.org/dataset542/volume3/part2
  https://a.example.org/dataset542/volume3/part2.pdf

Ce que fait le transfert de suffixe est de laisser votre ARK enregistré agir comme si vous aviez également enregistré ces trois ARK ci-dessous, qui seraient résolus par les pages ci-dessus, respectivement:

  https://n2t.net/ark:/12345/6789/volume3
  https://n2t.net/ark:/12345/6789/volume3/part2
  https://n2t.net/ark:/12345/6789/volume3/part2.pdf

Dans ce cas, le transfert de suffixe vous Ă©vite d’avoir Ă  conserver des enregistrements pour trois pages supplĂ©mentaires. En fait, cela fonctionne pour un nombre illimitĂ© de pages.

Quelles sont les parties d’un ARK ?


ARK ANATOMY
     Resolver Service   Base Object Name    Qualifiers
    __________________  _________________  _____________
   /                  \/         ...     \/             \
   https://example.org/ark:/12345/x54xz321/s3/f8.05v.tiff
           \_________/ \__/ \___/ \______/\____/\_______/
                |       |     |  ...  |     |       |
                |     Label   |   |   | Sub-parts  Variants
                |             |   |   |
Name Mapping Authority (NMA)  |   |  Assigned Name      ...
                              |   +---------- Shoulder: /x5
               Name Assigning Authority Number (NAAN)

Puis-je attribuer des ARK Ă  des composantes d’une ressource qui a dĂ©jĂ  un ARK ?

Oui, les ARK peuvent ĂȘtre attribuĂ©s Ă  n’importe quel niveau de granularitĂ©, tel qu’un manuscrit, des chapitres Ă  l’intĂ©rieur, des sections de chapitre, des sous-sections, etc. Un ARK peut Ă©galement ĂȘtre attribuĂ© Ă  une chose qui contient d’autres choses. Dans les ARK, le caractĂšre ‘/’ est rĂ©servĂ© pour aider l’utilisateur Ă  dĂ©couvrir la relation de composition. Par exemple, le premier objet ci-dessous contient le second :

ark:/12148/btv1b8449691v

ark:/12148/btv1b8449691v/f29

C’est le qualificatif de granularitĂ©. Il n’y a qu’un seul autre qualificatif ARK, qui indique les variantes de forme d’une chose en utilisant le caractĂšre rĂ©servĂ© ‘.’ devant un suffixe. Par exemple, ces ARK identifient des documents,

ark:/12148/btv1b8449691v/f29.pdf

ark:/12148/btv1b8449691v/f29.html

Comme ils ne diffĂšrent que par le suffixe .pdf ou .html, on peut en dĂ©duire qu’ils identifient deux formes diffĂ©rentes du mĂȘme document.

Espaces de noms et sous-espaces de noms ARK

Quel est le but du NAAN ?

L’objectif principal est d’éviter les conflits d’attribution. En obtenant un NAAN, une organisation obtient le droit exclusif de crĂ©er des ARK « sous » ce NAAN, qui fait partie d’un prĂ©fixe placĂ© devant tous ses ARK. L’ensemble des ARK que vous pouvez crĂ©er est infini et constitue l’espace de noms de votre NAAN. Cet espace est un sous-espace de noms (sous-ensemble) de l’espace de noms ARK (l’ensemble de tous les ARK possibles). Par exemple, l’espace de noms NAAN des Archives Internet regroupe tous les ARK commençant par « ark:/13960/ ». Les NAAN subdivisent l’espace de noms ARK en sous-espaces de noms distincts, chacun contenant un nombre infini d’ARK possibles. Puisque les organisations ne crĂ©ent des ARK que dans leurs propres espaces de noms, les attributions d’ARK entre organisations n’entreront jamais en conflit.

Les NAAN jouent Ă©galement un rĂŽle essentiel dans la rĂ©solution des conflits. Par exemple, si le rĂ©solveur N2T.net ne trouve pas d’ARK entrant dans sa base de donnĂ©es, il examine le NAAN entrant et le redirige vers le rĂ©solveur local enregistrĂ© auprĂšs du NAAN. Tout rĂ©solveur local peut ĂȘtre configurĂ© pour renvoyer la faveur aux ARK entrants contenant des NAAN qu’il ne connaĂźt pas, simplement en les redirigeant vers N2T.

Tous les NAAN doivent ĂȘtre enregistrĂ©s auprĂšs de N2T et rĂ©pertoriĂ©s dans le registre NAAN public, qui rĂ©pertorie Ă©galement le rĂ©solveur officiel de chaque NAAN.

Comment fonctionnent les espaces de noms ARK ?

Ils fonctionnent de la mĂȘme maniĂšre que tous les autres espaces de noms. Étant donnĂ© un prĂ©fixe associĂ© Ă  un espace de noms, ce prĂ©fixe peut ĂȘtre « étendu » (en ajoutant des caractĂšres Ă  sa fin) pour crĂ©er un nouveau sous-espace de noms (directement en dessous) associĂ© au prĂ©fixe Ă©tendu. Si les prĂ©fixes Ă©tendus n’entrent pas en conflit, les noms des espaces de noms associĂ©s ne le seront pas non plus. Un espace de noms peut ĂȘtre associĂ© Ă  n’importe quel prĂ©fixe, chacun pouvant comporter un nombre potentiellement infini de noms (ARK) commençant par lui.

Ensemble de tous les
ARK commençant par
Espace de noms associĂ© Exemple d’ARK dans
cet espace de noms
ark:/ Tous les ARK ark:/99999/fk4gt2m
ark:/12345/ ARK sous le NAAN 12345 ark:/12345/p987654
ark:/12345/x5 ARK sous le 12345/x5 shoulder ark:/12345/x5wf6789
ark:/12345/x5wf6789/ ARK sous le 12345/x5wf6789 objet ark:/12345/x5wf6789/c2/s4.pdf

Le tableau ci-dessus prĂ©sente des exemples de quatre niveaux d’espaces de noms/sous-espaces de noms courants. Le premier concerne tous les ARK et le second tous les ARK sous ark:12345. Le troisiĂšme est le concept du shoulder, dĂ©crit ci-dessous, qui est la subdivision suivante du NAAN ; notez qu’il n’est pas suivi de « / ».

Le quatriĂšme exemple, un ARK complet comme prĂ©fixe, montre qu’un objet ARK est lui-mĂȘme un espace de noms, avec une infinitĂ© de « sous-ARK » qui pourraient en dĂ©river pour nommer des parties et des variantes d’objets. CrĂ©er de nouveaux espaces de noms pour Ă©viter les conflits de noms est une pratique ancienne. Par exemple, une famille peut dĂ©signer quelqu’un comme Sam, la communautĂ© comme Sam Smith, le gouvernement comme Sam Smith, 4321 Main Street, Springfield, et l’histoire comme Sam Smith, 4321 Main Street, Springfield, 1888-1997.

Qu’est-ce qu’un shoulder ?

Un shoulder (jargon empruntĂ© Ă  la serrurerie) est un sous-espace de noms sous un NAAN. C’est l’ensemble de tous les ARK commençant par une extension courte et fixe du NAAN. Par exemple, dans

  ark:/12345/x5wf6789/c2/s4.pdf

le shoulder, /x5, Ă©tend le NAAN, 12345. La dĂ©signation courte, /x5, n’est pas unique dans de nombreux contextes ; il convient donc d’utiliser la dĂ©signation entiĂšrement qualifiĂ©e et unique au monde (par exemple, ark:/12345/x5). Dans la tradition classique des espaces de noms, le shoulder est l’ensemble de tous les ARK possibles commençant par le nom de le shoulder. Notre utilisation de ce terme est empruntĂ©e Ă  la serrurerie, qui comprend les jeux de clĂ©s comme Ă©tant dĂ©finis par des « shoulders » fixes et invariables prĂ©cĂ©dant les « lames » variables (formes qui diffĂšrent selon les clĂ©s partageant le mĂȘme shoulder) qui le suivent.

Les shoulders aident Ă  organiser un espace de noms NAAN sur le long terme. Ce n’est pas parce qu’un espace de noms contient un nombre infini d’ARK possibles qu’il est facile de trouver un ARK non attribuĂ©, en particulier lorsqu’au fil du temps, il existe – ou a existĂ©, ou pourrait exister – diffĂ©rentes opĂ©rations d’attribution d’ARK indĂ©pendantes sous celui-ci. Tout comme la communautĂ© ARK met de cĂŽtĂ© les espaces de noms NAAN des organisations, chaque organisation est encouragĂ©e Ă  mettre de cĂŽtĂ© des sous-espaces de noms de shoulder. Si vous n’utilisez pas les shoulders dĂšs le dĂ©but, mĂȘme pour un simple flux d’affectations, vous risquez de crĂ©er un chaos lĂ©ger mais permanent dans votre espace de noms NAAN, et vous risquez de demander un NAAN supplĂ©mentaire (ce qui est dĂ©conseillĂ©) pour les futurs flux d’affectations.

Quel est le but d’un shoulder ?

Un shoulder est comparable Ă  une chambre d’amis dans votre maison. Imaginez une collĂšgue, Sally, qui hĂ©berge un locataire de longue date, Larry. Bien que son logement soit extrĂȘmement spacieux (en fait, il est infini), Sally se plaint que Larry laisse traĂźner des objets en permanence dans toute la maison : son manteau sur la chaise de la cuisine, ses verres sur la table Ă  manger, un livre sur son bureau, des pantoufles prĂšs du canapĂ©, une tasse de cafĂ© sur le lavabo de la salle de bain, etc. Selon les termes de son contrat de logement, les affaires de Larry, une fois placĂ©es, ne peuvent plus ĂȘtre dĂ©placĂ©es. Mais Sally, qui a Ă©galement besoin de place pour ses affaires et pourrait accueillir de nouveaux locataires plus tard, est obligĂ©e de constamment observer et de ne pas dĂ©ranger les affaires de Larry dans les parties de la maison qu’elle utilise souvent.

Comprenant les difficultĂ©s de Sally, vous pourriez exiger de chacun de vos invitĂ©s qu’ils acceptent de ne dĂ©poser leurs affaires que dans leur chambre (leur shoulder). GrĂące Ă  un tel accord, non seulement le domicile de Sally aurait Ă©tĂ© peu perturbĂ© par les affaires de Larry, mais elle aurait Ă©galement pu accueillir autant de nouveaux locataires (nouvelles opĂ©rations d’affectation) que nĂ©cessaire dans le cadre d’accords similaires.

Les shoulders permettent donc de dĂ©lĂ©guer l’affectation d’ARK sous un NAAN Ă  des projets ou divisions autonomes, tout comme les NAAN le font sous l’espace de noms ARK global. MĂȘme si une organisation n’a initialement besoin de crĂ©er des ARK que pour un seul projet, les plans peuvent Ă©voluer. Si d’autres besoins d’ARK apparaissent ultĂ©rieurement, rĂ©server un nouveau shoulder pour chaque nouveau projet ou division permet de garantir facilement l’absence de conflit entre les flux d’affectation indĂ©pendants (prĂ©sents, passĂ©s ou futurs), grĂące Ă  des espaces de noms non chevauchants. (Les shoulders peuvent Ă©galement attĂ©nuer le problĂšme de division des espaces de noms.) Pour en savoir plus sur les shoulders, veuillez consulter la brĂšve FAQ sur les shoulders ARK.

Pourrais-je crĂ©er des ARK sur un NAAN qui n’appartient pas Ă  mon organisation ?

Oui, car il existe quatre NAAN partagĂ©s avec une sĂ©mantique particuliĂšre dont vous pourriez vouloir tirer parti. Normalement, les ARK Ă  long terme et leurs NAAN devraient ĂȘtre opaques, rĂ©vĂ©lant peu de choses sur leur affectation, mais la sĂ©mantique du tableau ci-dessous est considĂ©rĂ©e comme suffisamment immuable pour ne pas compromettre leur pĂ©rennitĂ©. Chaque NAAN partagĂ© possĂšde des connotations particuliĂšres que les logiciels et les personnes suffisamment formĂ©es peuvent reconnaĂźtre et exploiter, ce qui offre un certain soulagement face Ă  la difficultĂ© d’utiliser des identifiants opaques.

Les NAAN partagĂ©s n’appartiennent Ă  aucune organisation. CrĂ©er des ARK sans conflit sous un NAAN partagĂ© nĂ©cessite, comme vous pouvez l’imaginer, de rĂ©server un shoulder, ce qui nĂ©cessite de remplir un formulaire en ligne pour demander un shoulder sous un NAAN partagĂ© (veuillez ne pas utiliser ce formulaire pour les shoulders sous votre propre NAAN non partagĂ©).

NAAN partagé
signification
Objectif, signification ou connotation des ARK avec ce NAAN.
(Il est acceptable que ces NAAN soient non opaques, car leur signification est immuable.)
Prévision de résolution ? Référence à long terme ?
12345 exemples Exemples d’ARK apparaissant dans la documentation. Ils pourraient ĂȘtre rĂ©solus, mais aucun vĂ©rificateur de liens n’a Ă  s’inquiĂ©ter s’ils ne le sont pas. Ils ne devraient pas ĂȘtre considĂ©rĂ©s comme viables pour une rĂ©fĂ©rence Ă  long terme. peut-ĂȘtre non
99152 termes ARK pour les termes de vocabulaire contrĂŽlĂ© et d’ontologie, tels que les noms d’élĂ©ments de mĂ©tadonnĂ©es et les valeurs de liste de sĂ©lection. Ils devraient ĂȘtre rĂ©solus en dĂ©finitions de termes et conviennent Ă  une rĂ©fĂ©rence Ă  long terme. oui oui
99166 agents ARK pour les personnes, les groupes et les institutions en tant qu’« agents » (acteurs, tels que les crĂ©ateurs, les contributeurs, les Ă©diteurs, les interprĂštes, etc.). Elles doivent correspondre aux dĂ©finitions d’agent et conviennent Ă  une rĂ©fĂ©rence Ă  long terme. oui oui
99999
test ids
ARK Ă  des fins de test, de dĂ©veloppement ou d’expĂ©rimentation, souvent Ă  grande Ă©chelle. Elles peuvent ĂȘtre rĂ©solues, mais aucun vĂ©rificateur de liens n’a Ă  s’inquiĂ©ter si ce n’est pas le cas. Elles ne doivent pas ĂȘtre considĂ©rĂ©es comme viables pour une rĂ©fĂ©rence Ă  long terme. peut-ĂȘtre non

Les ARK 99999 et 12345 (« non rĂ©els ») sont particuliĂšrement utiles si vous ĂȘtes chargĂ© de vĂ©rifier les rapports de liens brisĂ©s. Sauf indication contraire, les erreurs des ARK contenant ces NAAN peuvent ĂȘtre ignorĂ©es. Cela permet d’éviter bien des efforts inutiles, car malgrĂ© tous les efforts des fournisseurs, ces ARK non rĂ©els disparaissent souvent Ă  la vue de tous. Les destinataires (par exemple, les personnes et les vĂ©rificateurs de liens) normalement concernĂ©s par les liens brisĂ©s n’ont qu’à reconnaĂźtre ces deux NAAN spĂ©cifiques pour Ă©viter d’ĂȘtre distraits par eux. (Notez que la sĂ©mantique non rĂ©elle demeure mĂȘme si les objets n’existent pas.)

Puis-je apporter des modifications Ă  un NAAN ?

Vous pouvez demander une modification de l’entrĂ©e de registre d’un NAAN relatif Ă  votre organisation en remplissant le mĂȘme formulaire en ligne que celui utilisĂ© pour demander un nouveau NAAN. Pour des raisons de sĂ©curitĂ©, les demandes sont traitĂ©es manuellement. Voici quelques exemples de motifs de modification :

ARK et les autres identifiants

Pourquoi utiliser des ARK plutĂŽt que des DOI, par exemple ?

Qu’ont en commun ARK, DOI, Handle, PURL et URN ?

Voici les principaux types (ou schĂ©mas) d’identifiants persistants.

Ils ont également une structure trÚs similaire, comme le montrent les exemples ci-dessous, composée de quatre parties :

https://n2t.net/ark:/99999/12345
https://doi.org/11.99999/12345
https://handle.net/10.99999/12345
https://purl.org/99999/12345
https:///urn:99999:12345
  1. le protocole (https://) plus un nom d’hîte,
2. juste pour ARK et URN, il y a aussi une Ă©tiquette (“ark:” ou “urn:”),
3. l’autoritĂ© d’attribution du nom (99999, 10.99999 ou 99999), qui est l’organisation ou le groupe qui a créé un identifiant particulier,
4. et enfin, le nom, ou identifiant local, qu’il a attribuĂ© (12345).

Et ils ont tous peu d’effet sur la persistance. Voir 10 mythes persistants sur les identifiants persistants.

Attendez, vous voulez dire que ARK, DOI, Handle, PURL et URN sont inutiles ?

Non, ce serait une affirmation excessive. Mais remettons ces formats d’identifiant (types) en perspective :

Étant donnĂ© le peu de choses que ces formats font pour vous, lorsque vous en choisissez un, vous prendrez probablement en compte des facteurs tels que le coĂ»t, le risque et l’ouverture.

En quoi les ARK diffĂšrent-ils des identifiants tels que les DOI, les Handle, les PURL et les URN ?

La réponse courte

Les ARK sont les seuls identifiants standards, non cloisonnĂ©s et non payants que vous pouvez enregistrer et utiliser en environ 48 heures. Les DOI, les Handle et les PURL nĂ©cessitent une rĂ©solution et d’autres services exigĂ©s par leurs systĂšmes centralisĂ©s respectifs (« silos »).

Cela ne veut pas dire que la permanence est gratuite. Rendre un identifiant pĂ©renne, en tant que fournisseur, vous impose des coĂ»ts de gestion, d’hĂ©bergement, de surveillance et de redirection. Vous pouvez faire ces choses vous-mĂȘme ou avec l’aide d’un prestataire. Mais avec les ARK, comme avec les URL, vos identifiants ne vous seront pas facturĂ©s individuellement et vous ne serez pas enfermĂ©s dans un silo n’acceptant qu’un type de rĂ©solution spĂ©cifique et qui refuse donc les autres identifiants.

Les ARK ont la particularitĂ© d’ĂȘtre dĂ©centralisĂ©s. Bien que l’on puisse obtenir des services de rĂ©solution d’un rĂ©solveur ARK global appelĂ© n2t.net, plus de 90% des ARK dans le monde ne l’utilisent pas comme rĂ©solveur. Plus de 650 organisations enregistrĂ©es Ă  travers le monde ont créé par elles-mĂȘmes environ 3,2 milliards d’ARK et, Ă  l’instar des URL, personne n’a jamais payĂ© de frais pour les crĂ©er. Bien sĂ»r, les maintenir n’est pas gratuit. Conserver l’accĂšs au contenu de maniĂšre pĂ©renne sur le long terme, quel que soit le type d’identifiant, n’est jamais gratuit.

D’autres diffĂ©rences entre ARK, DOI, Handle, PURL et URN

Mais si les ARK peuvent ĂȘtre supprimĂ©s, comment peut-on leur faire confiance ?

En rĂ©alitĂ©, cela rend les ARK plus fiables. La possibilitĂ© de supprimer est un Ă©lĂ©ment essentiel d’une saine gestion de collections. Les types d’identifiants autres qu’ARK interdisent la suppression, en partant du principe que les personnes, lorsqu’elles sont invitĂ©es Ă  intervenir, ne commettront pas d’erreur. Les personnes aux commandes d’un outil de gestion d’identifiants font rĂ©guliĂšrement d’une simple inadvertance humaine une erreur Ă  grande Ă©chelle, mĂȘme au dĂ©but de leur engagement. En rendant la correction difficile, nous condamnons les systĂšmes Ă  traĂźner ces bourdes pour l’éternitĂ©.

Bien qu’ils ne soient pas Ă  l’abri de telles erreurs, les ARK ont le grand avantage de pouvoir ĂȘtre créés et supprimĂ©s dans l’ombre, en dehors de toute publication, ou d’engagement de conservation.

Un objet peut-il avoir Ă  la fois un ARK et un DOI ?

Oui. Parfois, avoir deux identifiants est utile, bien que cela puisse devenir dĂ©routant quand cela se produit souvent. Beaucoup de gens commencent par attribuer des ARK Ă  chaque Ă©lĂ©ment créé afin de disposer d’une rĂ©fĂ©rence stable dĂšs le dĂ©but, avant de savoir s’ils souhaitent le publier ni mĂȘme le conserver.

L’objet et ses mĂ©tadonnĂ©es Ă©voluent conjointement, et pour le sous-ensemble d’élĂ©ments que vous souhaitez publier dans des contextes nĂ©cessitant des DOI, vous pouvez en attribuer au moment de la publication. Si votre ARK est stable et contient des mĂ©tadonnĂ©es de base, vous faites dĂ©jĂ  tout le nĂ©cessaire pour obtenir un bon DOI. C’est en cela que les ARK sont adaptĂ©s aux objets Ă  un stade prĂ©coce de dĂ©veloppement.

Pour gĂ©rer efficacement deux identifiants, il est recommandĂ© de crĂ©er le DOI de maniĂšre Ă  ce qu’il redirige vers l’ARK d’origine. Cela Ă©limine non seulement la nĂ©cessitĂ© de mettre Ă  jour la redirection DOI, mais maintient Ă©galement l’ARK pĂ©renne pour tous ceux qui l’ont prĂ©cĂ©demment enregistrĂ© ou marquĂ© d’un signet.

Quand dois-je utiliser ARK plutĂŽt que DOI, Handle, PURL ou URN ?

Il n’y a pas de rĂ©ponse simple. La question des identifiants (non les choses, mais leurs noms) est complexe, alors si vous entendez des rĂ©ponses simples ailleurs, mĂ©fiez-vous des erreurs courantes.

Aucune caractĂ©ristique d’ARK, DOI, Handle, PURL ou URN ne les rend plus ou moins adaptĂ©s Ă  une discipline, un domaine ou un secteur particuliers. Avec un rĂ©solveur d’identifiants et un systĂšme de gestion, ils fournissent tous le service essentiel : la rĂ©solution (tout comme des URL correctement gĂ©rĂ©es).

Certaines considĂ©rations spĂ©cifiques Ă  un type d’identifiant s’expliquent parfois par le fait que la rĂ©solution et la gestion de ce type sont verrouillĂ©es par un prestataire ou un fournisseur de service donnĂ©s. Par exemple, de nombreuses fonctionnalitĂ©s et restrictions de PURL ou Handle sont dĂ©terminĂ©es par leurs silos d’administration respectifs, de mĂȘme que celles des DOI, basĂ©s sur les Handle. En revanche les DOI ont des pratiques de mĂ©tadonnĂ©es variĂ©es et Ă©volutives d’une agence d’enregistrement Ă  l’autre.

Les diffĂ©rences concrĂštes que nous remarquons, sur les mĂ©tadonnĂ©es, les pages d’accueil et l’intĂ©gration d’outils (par exemple, les outils de publication), ne sont pas des propriĂ©tĂ©s des formats d’identifiants en soi, mais des propriĂ©tĂ©s de rĂ©solution, de gestion et de services de citation que divers fournisseurs Ă©tendent ou limitent. Ces services sont dĂ©finis Ă  leur tour par les communautĂ©s d’utilisateurs et de clients. Les services de base reposent sur une base de donnĂ©es fiable contenant chaque identifiant, ainsi que des Ă©lĂ©ments de mĂ©tadonnĂ©es (crĂ©ateur, titre, date, URL de redirection, etc.) dĂ©crivant l’objet identifiĂ©. Les services supplĂ©mentaires incluent la vĂ©rification des liens, la dĂ©tection des doublons, la gĂ©nĂ©ration de rapports et la recherche.

Du berceau au tombeau

Quand dois-je créer des ARK dans mon processus de travail ?

À la naissance de l’objet, ou mĂȘme avant. Nous nommons gĂ©nĂ©ralement nos enfants avant leur naissance, et nous appelons et nous rĂ©fĂ©rons Ă  des objets au stade de la conception, parfois longtemps avant qu’ils ne portent leurs fruits. Selon le niveau de prĂ©cision de vos prĂ©visions, vos objets Ă  naĂźtre peuvent avoir des ARK fonctionnels qui fournissent un substitut appropriĂ© et renvoient des mĂ©tadonnĂ©es riches, y compris des dĂ©clarations de permanence.

La seule mise en garde consiste Ă  ĂȘtre prudent lors de la publication d’ARK dont les perspectives Ă  long terme sont incertaines. Certains systĂšmes de gestion d’identifiant possĂšdent des fonctionnalitĂ©s permettant de gĂ©rer et de rĂ©soudre les identifiants non validĂ©s (par exemple, EZID dispose d’un statut « rĂ©servĂ© »). Plus il y a de personnes qui connaissent un ARK, plus il est difficile de le supprimer.

Comment se fait-il que les ARK puissent ĂȘtre faciles Ă  supprimer ?

Si personne d’autre que vous ne connaĂźt un identifiant, rien ne vous empĂȘche de le supprimer ou de le retirer. Pour schĂ©matiser, un identifiant est en rĂ©alitĂ© l’affirmation qu’une chaĂźne de caractĂšres donnĂ©e est associĂ©e Ă  une chose spĂ©cifique. Moins vous en parlez, plus il est facile de supprimer cette affirmation. Si vous crĂ©ez un URL et ne le partagez qu’avec vos collĂšgues les plus proches, il sera beaucoup plus facile de le retirer que s’il apparaissait pendant un mois sur un site Web public, Ă  partir duquel il aurait Ă©tĂ© collectĂ© par les moteurs de recherche Internet. En revanche, il est difficile de supprimer les DOI et les Handle, car une fois enregistrĂ©s et rĂ©solus, ils sont effectivement diffusĂ©s dans le monde entier.

Les ARK se comportent comme des URL à cet égard. Les fournisseurs sont libres de créer et de partager des ARK de maniÚre restreinte, auquel cas ils sont faciles à supprimer.

Cela peut surprendre, mais mĂȘme s’ils sont plus largement diffusĂ©s, les ARK peuvent ĂȘtre accompagnĂ©es de dĂ©clarations de permanence qui indiquent quel niveau d’engagement – Ă©levĂ© ou bas – on garantit. Les ARK ont Ă©tĂ© conçus pour disposer d’une palette de dĂ©clarations de permanence, mais celles-ci ne sont en aucun cas exhaustives pour des identifiants et des objets qui prĂ©sentent une grande variĂ©tĂ© de « saveurs » d’engagement. C’est pourquoi on parle des ARK comme d’identifiants de haute performance adaptĂ©s Ă  la permanence plutĂŽt que comme des « identifiants pĂ©rennes ».

Enfin, les gens commettent des erreurs. Des ARK, des DOI, des Handle, des PURL et des URN sont parfois diffusĂ©s par erreur et doivent ĂȘtre retirĂ©s. Lorsque cela se produit, la meilleure option du fournisseur consiste Ă  rĂ©soudre l’identifiant retirĂ© en donnant accĂšs Ă  une page « fantĂŽme » qui explique et Ă©ventuellement prĂ©sente des excuses pour le dĂ©sagrĂ©ment occasionnĂ©. Contrairement aux idĂ©es reçues, les identifiants pĂ©rennes n’offrent aucune garantie.

Pourquoi dit-on que les ARK sont adaptés à des objets dans un stade précoce de développement ?

On a besoin d’identifiants avant de savoir exactement Ă  quel objet ils se rĂ©fĂšrent, ou s’ils font rĂ©fĂ©rence Ă  quelque chose qui mĂ©rite d’ĂȘtre gardĂ©. Un identifiant exigeant des mĂ©tadonnĂ©es abouties ne peut pas ĂȘtre créé au dĂ©but du dĂ©veloppement car l’objet est mal connu. C’est pourquoi les crĂ©ateurs d’objets attribuent presque toujours initialement des identifiants sans exigences de mĂ©tadonnĂ©es, tels que des URL ou des ARK.

En commençant par attribuer un ARK, vous bĂ©nĂ©ficiez de la possibilitĂ© de conserver l’identifiant d’origine de la naissance Ă  la diffusion publique alors que l’objet et ses mĂ©tadonnĂ©es Ă©voluent. De nombreux objets passent par des phases de dĂ©veloppement et de correction intensives, durant parfois plusieurs annĂ©es, au cours desquelles ils sont trop immatures pour rĂ©pondre Ă  la plupart des exigences en matiĂšre de mĂ©tadonnĂ©es. NĂ©anmoins, chaque objet a besoin d’une sorte d’identifiant, de la conception Ă  la maturitĂ©, cette derniĂšre consistant en une publication et en une amĂ©lioration, ou en un abandon. Il est facile d’abandonner des ARK qui n’ont pas Ă©tĂ© dĂ©voilĂ©s au public.

Comme l’objet lui-mĂȘme, les Ă©lĂ©ments de mĂ©tadonnĂ©es ont besoin de flexibilitĂ© pour se dĂ©velopper et Ă©voluer avec le temps :

Contrairement aux DOI Crossref et DataCite, qui nĂ©cessitent des mĂ©tadonnĂ©es spĂ©cifiques (voir, par exemple, le schĂ©ma DataCite), les ARK n’exercent aucune contrainte sur ces activitĂ©s. Mieux encore, le rĂ©solveur N2T.net permet effectivement de les prendre toutes en compte.

Si les ARK ne les exigent pas, pourquoi se donner la peine de créer des métadonnées ?

La crĂ©ation de mĂ©tadonnĂ©es (informations supplĂ©mentaires associĂ©es Ă  ou dĂ©crivant un objet) prĂ©sente plusieurs avantages essentiels. PremiĂšrement, quelle que soit la cible de l’ARK - une page d’accueil ou un fichier - les mĂ©tadonnĂ©es fournissent aux utilisateurs des informations essentielles sur l’objet, telles que des rĂ©fĂ©rences Ă  des versions plus rĂ©centes, une date de crĂ©ation, une provenance, etc. Dans le cas des ARK, les mĂ©tadonnĂ©es sont gĂ©nĂ©ralement accessibles via des inflexions.

Les mĂ©tadonnĂ©es facilitent vraiment l’utilisation d’identifiants opaques, qui ne rĂ©vĂšlent aucun indice sur ce qu’ils identifient. En l’absence de mĂ©tadonnĂ©es, vous ĂȘtes obligĂ© d’accĂ©der Ă  l’objet lui-mĂȘme pour vous rappeler de quoi il s’agit et Ă©galement pour vous assurer que vous accĂ©dez au bon objet. De plus, la divergence entre les mĂ©tadonnĂ©es renvoyĂ©es et l’objet consultĂ© aide tout le monde Ă  dĂ©tecter des modifications ou des erreurs d’identification.

Les mĂ©tadonnĂ©es sont adaptĂ©es aux objets aboutis et sont beaucoup moins importantes pour les objets et les identifiants immatures que pour ceux qui ont Ă©tĂ© publiĂ©s. Avoir des mĂ©tadonnĂ©es dĂ©montre la crĂ©dibilitĂ© du fournisseur et son engagement vis-Ă -vis d’identifiants de haute performance. Tous les fournisseurs ne sont pas Ă  la hauteur de cette tĂąche.

Cela n’est pas nĂ©cessairement cher. Les mĂ©tadonnĂ©es créées Ă  partir de zĂ©ro peuvent ĂȘtre coĂ»teuses, mais elles sont gĂ©nĂ©ralement produites et gĂ©rĂ©es par des fournisseurs d’objets, auquel cas elles peuvent ĂȘtre exploitĂ©es efficacement pour les identifiants. IdĂ©alement, pour une permanence maximale, les mĂ©tadonnĂ©es principales (gĂ©rĂ©es par les fournisseurs d’objet) devraient ĂȘtre rĂ©pliquĂ©es dans des systĂšmes indĂ©pendants afin qu’il soit difficile pour une personne d’altĂ©rer de maniĂšre indĂ©tectable les associations d’identifiants. Par exemple, les entrepĂŽts d’objets numĂ©riques qui obtiennent des ARK et des DOI du service EZID stockent une copie de leurs mĂ©tadonnĂ©es dans EZID, qui en stocke une autre copie dans le rĂ©solveur N2T.net.

Quelles métadonnées sont recommandées pour les ARK ?

La question des mĂ©tadonnĂ©es est complexe pour tous les identifiants, pas seulement pour ARK. Il existe des milliers de normes selon les domaines et les types d’objets, la plupart d’entre elles se recoupant tout en se contredisant, et chacune d’elles est appliquĂ©e conformĂ©ment aux pratiques locales de l’organisation avec diffĂ©rents niveaux de conformitĂ©. Le choix ou la crĂ©ation d’une spĂ©cification pour vos mĂ©tadonnĂ©es dĂ©pend de facteurs tels que

Une interopĂ©rabilitĂ© fiable entre domaines peut s’avĂ©rer difficile, mais Dublin Core, DataCite, Schema.org et Dublin Kernel sont des spĂ©cifications de mĂ©tadonnĂ©es standard Ă  envisager pour une utilisation conjointe avec ARK.

Pourquoi est-ce que je vois des mĂ©tadonnĂ©es ARK avec les termes « qui », « quoi », « quand », « oĂč » ?

Les ARK ont Ă©tĂ© conçus pour identifier n’importe quoi, pas seulement des choses qui sont, par exemple, publiables ou achetables. Il n’est pas naturel de modĂ©liser un fossile, un Ă©chantillon de tissu, un terme de vocabulaire ou Marie Curie comme si chacun avait un auteur, un titre, un Ă©diteur, un copyright et un prix. Au lieu de quoi, depuis 2001, un ARK est gĂ©nĂ©ralement accompagnĂ© d’un noyau de mĂ©tadonnĂ©es gĂ©nĂ©riques de quatre Ă©lĂ©ments (Dublin Kernel, inspirĂ© de Dublin Core (DC)), suivi de tout autre Ă©lĂ©ment de mĂ©tadonnĂ©e (paire attribut / valeur) que le fournisseur souhaite donner. Ce noyau de mĂ©tadonnĂ©es est structurĂ© pour rĂ©pondre aux questions suivantes : « qui ? », « quoi ? », « quand ? » et « oĂč ? » sur l’expression ou le « rĂ©cit » d’un objet :

Il y a beaucoup Ă  dire sur les mĂ©tadonnĂ©es et ARK (par exemple, sur l’application des Ă©lĂ©ments « qui », « quoi », « quand » et « oĂč » au contenu d’une biographie, ou comment une institution de conservation prĂ©voit de maintenir un jeu de donnĂ©es). Des recommandations supplĂ©mentaires sur les mĂ©tadonnĂ©es et ARK seront disponibles sur arks.org. D’autres Ă©lĂ©ments sont essentiels, tels que

Qu’est-ce qu’une « inflexion » et en quoi diffĂšre-t-elle de la « nĂ©gociation de contenu » ?

Une inflexion est une dĂ©sinence Ă  la fin d’un mot qui exprime un changement de sens. Cela permet de dĂ©finir un mot tel que « aller » sans dĂ©finir Ă©galement « allez » et « allons ». Pour un ARK qui mĂšne Ă  un objet, ajouter simplement un « ? » Ă  la fin (« ? » est un exemple d’inflexion ARK) nous permet de demander des mĂ©tadonnĂ©es sans avoir Ă  dĂ©finir un identifiant distinct pour les mĂ©tadonnĂ©es de l’objet. Cette technique simple peut ĂȘtre utilisĂ©e par un humain avec un navigateur Web. Le rĂ©solveur N2T prend en charge les inflexions et la nĂ©gociation de contenu.

La nĂ©gociation de contenu pour les mĂ©tadonnĂ©es est une technique logicielle permettant de demander d’autres formats d’objet, tels que le format PDF ou RTF d’un fichier HTML. Bien que cela n’ait pas Ă©tĂ© conçu pour cela, la « nĂ©gociation de contenu » originelle Ă©tait dĂ©tournĂ©e dans certains cas pour demander des mĂ©tadonnĂ©es, en considĂ©rant curieusement que les formats de fichier souvent utilisĂ©s pour exprimer des mĂ©tadonnĂ©es ne pouvaient vĂ©hiculer que des mĂ©tadonnĂ©es et jamais des objets Ă  part entiĂšre. Contrairement aux inflexions, la « nĂ©gociation de contenu pour les mĂ©tadonnĂ©es » ne fonctionne pas du tout pour les objets reprĂ©sentĂ©s dans ces formats (formats dont la liste ne cesse de s’allonger et n’est connue que par convention tacite) et n’est pas assez simple d’utilisation pour la plupart des usagers humains.

Bien que les inflexions soient gĂ©nĂ©ralement associĂ©es aux ARK, elles ne leur sont pas rĂ©servĂ©es. Contrairement aux idĂ©es reçues, les identifiants ne font rien ; ce sont leurs rĂ©solveurs qui gĂšrent ou non des fonctionnalitĂ©s. Ainsi, par exemple, les inflexions et le « transfert de suffixe » sont pris en charge par n2t.net pour tous les types d’identifiants, mais pas par doi.org ni par handle.net (qui dispose d’une fonctionnalitĂ© similaire appelĂ©e « Template Handles ») pour aucun type d’identifiant.

Qu’entendez-vous par « silos » ?

En rĂšgle gĂ©nĂ©rale, les services basĂ©s sur des formats d’identifiant sont conçus comme des silos, ou des plates-formes fermĂ©es, gĂ©rant un type d’identifiant particulier tel que Handle, DOI ou PURL. Chaque silo remplit les mĂȘmes fonctions principales - associer des noms (chaĂźnes de caractĂšres d’identifiant) Ă  des choses (objets ou mĂ©tadonnĂ©es). L’exclusion de tous les types d’identifiant, sauf un, peut aider Ă  conquĂ©rir des marchĂ©s, mais elle est contre-productive et exclusive. Elle nĂ©cessite la reconstruction du mĂȘme ensemble de services pour chaque format et viole les principes de base de l’ouverture.

À l’inverse, le rĂ©solveur N2T (Name-to-Thing) et l’interface de gestion EZID (« identifiants simples ») ont Ă©tĂ© conçus pour gĂ©rer tout identifiant. Les efforts consacrĂ©s Ă  toute nouvelle fonctionnalitĂ© peuvent ĂȘtre Ă©tendus avec profit Ă  tous les types, ce qui permet une surprenante flexibilitĂ©. Par exemple, les ARK sont souvent stockĂ©s dans EZID avec des mĂ©tadonnĂ©es DOI, et chaque DOI stockĂ© dans N2T peut bĂ©nĂ©ficier des fonctionnalitĂ©s de rĂ©solution ARK telles que les inflexions et le « transfert de suffixe », qui ne sont pas disponibles via le rĂ©solveur DOI principal (doi.org).