En envoyant un e-mail Ă la liste de diffusion ARK ou en nous contactant ici.
Les ARK (Archival Resource Key) sont des identifiants de haute performance qui vous donnent accĂšs Ă des choses et Ă des descriptions de ces choses. Par exemple, cet ARK,
https://n2t.net/ark:/67531/metadc107835/
vous donne accĂšs Ă une thĂšse, et, en ajoutant â??â Ă la fin de lâARK, devrait vous amener Ă sa description :
https://n2t.net/ark:/67531/metadc107835/??
Sur Internet, un identifiant est une URL, ou une partie dâURL. Par exemple, cet identifiant ARK principal,
ark:/12148/btv1b8449691v/f29
figure dans deux URL (Uniform Resource Locators, également appelés « liens Web » ou « adresses Web ») différentes :
http://ark.bnf.fr/ark:/12148/btv1b8449691v/f29
https://n2t.net/ark:/12148/btv1b8449691v/f29
Les ARK sont plus particuliĂšrement destinĂ©s Ă ĂȘtre des identifiants pĂ©rennes.
On a estimĂ© que la durĂ©e de vie moyenne dâun URL Ă©tait de 44 jours. La fin de la vie dâun URL advient lorsque celui-ci se « rompt » ; il vous retourne alors la redoutable erreur â404 Introuvableâ que la plupart dâentre nous connaissent bien. Non seulement câest agaçant, mais câest en outre politiquement embarrassant lorsque lâon recherche des publications scientifiques financĂ©es sur fonds publics, et câest un dĂ©sastre culturel pour les bibliothĂšques, les archives, les musĂ©es et autres institutions mĂ©morielles.
Parmi les multiples liens qui peuvent ou ont pu vous conduire Ă une chose, un identifiant pĂ©renne est un lien qui, en principe, continue de fonctionner trĂšs longtemps. Les services qui permettent la dĂ©couverte et lâinterconnexion de ressources (comme entre les articles universitaires, les auteurs, les donnĂ©es de la recherche et les sujets connexes) prĂ©fĂšrent les identifiants pĂ©rennes en raison de cette stabilitĂ©.
Les identifiants pĂ©rennes devraient continuer Ă fonctionner mĂȘme lorsque les choses sont dĂ©placĂ©es dâun site Web Ă un autre. Normalement, lorsque les choses sont dĂ©placĂ©es, tous ceux qui ont dĂ©jĂ enregistrĂ© les anciens liens devraient ĂȘtre informĂ©s des nouveaux, ce qui est presque impossible. Câest alors quâinterviennent les rĂ©solveurs dâidentifiants.
Un rĂ©solveur est un site Web spĂ©cialisĂ© dans la rĂ©orientation dâidentifiants entrants (ceux initialement annoncĂ©s aux utilisateurs) vers les sites Web actuellement les mieux Ă mĂȘme de les traiter. Ce transfert est gĂ©nĂ©ralement appelĂ© « rĂ©solution » et une des Ă©tapes de ce processus de rĂ©solution la « redirection ».
Pour quâun rĂ©solveur fonctionne, son nom dâhĂŽte - hostname en anglais - (« n2t.net » ou « ark.bnf.fr » dans les identifiants ci-dessus) doit ĂȘtre soigneusement choisi afin quâil ne soit plus nĂ©cessaire de le changer. Les noms dâhĂŽte des institutions mĂ©morielles, dont certaines sont vieilles de plusieurs siĂšcles, sont souvent de bons candidats pour devenir des rĂ©solveurs. On citera dâautres rĂ©solveurs, plus rĂ©cents et plus connus : n2t.net (le rĂ©solveur ARK), identifiers.org, doi.org, handle.net et purl.org.
Ă toute chose numĂ©rique, physique ou abstraite. Cela inclut les choses qui nâexistent pas encore mais auxquelles vous devez faire rĂ©fĂ©rence depuis des objets que vous crĂ©ez ou prĂ©voyez de crĂ©er, comme un lien depuis le brouillon dâun article vers un jeu de donnĂ©es en prĂ©paration, ou un lien depuis une lettre numĂ©rique archivĂ©e vers un instrument de recherche Ă crĂ©er. Attention, vous ne devriez attribuer des ARK quâĂ des choses que vous possĂ©dez, contrĂŽlez ou gĂ©rez. Attribuer des ARK Ă des choses que vous ne contrĂŽlez pas est dĂ©conseillĂ© car de tels identifiants sont gĂ©nĂ©ralement fragiles.
Vous trouverez ci-dessous une liste de choses qui reçoivent des ARK. Les nombres sont une estimation produite en septembre 2019 par les organisations elles-mĂȘmes.
Difficile Ă dire car les ARK sont dĂ©centralisĂ©s, mais plus de 600 organisations enregistrĂ©es ont créé, selon leurs estimations, environ 3,2 milliards dâARK. Vous trouverez des ARK utilisĂ©s comme permaliens dans
Voici la rĂ©partition globale des organisations enregistrĂ©es comme attributrices dâARK en avril 2020. Cliquez sur lâimage ci-dessous pour accĂ©der Ă une carte Ă jour et zoomable.
Tout dâabord, vous avez besoin dâun NAAN (numĂ©ro dâautoritĂ© nommante, ou Name Assigning Authority Number en anglais), qui est un numĂ©ro exclusivement rĂ©servĂ© Ă votre organisation. Il doit apparaĂźtre dans chaque ARK attribuĂ© par votre organisation, juste aprĂšs lâĂ©tiquette âark:/â. Le NAAN de tous ces ARK
ark:/12148/btv1b8449691v/f29
http://ark.bnf.fr/ark:/12148/btv1b8449691v/f29
https://n2t.net/ark:/12148/btv1b8449691v/f29
est 12148 ; il identifie de maniĂšre unique la BibliothĂšque nationale de France. Chaque NAAN est associĂ© Ă lâURL dâun rĂ©solveur pour ses ARK. Par exemple, pour rĂ©soudre un ARK en 12148, apposez-le aprĂšs http://ark.bnf.fr/ comme indiquĂ© ci-dessus. Le rĂ©solveur N2T.net est Ă part dans la mesure oĂč il transmet tout ARK au rĂ©solveur associĂ© Ă son NAAN.
Lâobtention ou lâutilisation dâun NAAN est gratuite et vous pouvez en demander un en remplissant un formulaire en ligne. Plus de 650 organisations (bibliothĂšques, archives, musĂ©es, facultĂ©s, agences gouvernementales, Ă©diteurs scientifiques et pĂ©dagogiques, projets, etc.) ont un NAAN rĂ©pertoriĂ© dans le registre public NAAN.
Vous ĂȘtes libre de crĂ©er des chaĂźnes de caractĂšre ARK Ă votre guise, Ă condition que vous nâutilisiez que des chiffres, des lettres (ASCII, donc sans aucun signe diacritique) et les caractĂšres suivants :
= ~ * + @ _ $ . /
Les deux derniers caractĂšres sont rĂ©servĂ©s pour le cas oĂč vous souhaiteriez divulguer des relations entre ARK.
Une autre des caractĂ©ristiques des ARK est que les traits dâunion (â-â) peuvent ĂȘtre utilisĂ©s mais quâils sont inertes en ce qui concerne lâidentitĂ©, ce qui signifie que des chaĂźnes ne diffĂ©rant que par des traits dâunion sont considĂ©rĂ©es comme identiques ; par exemple, ces chaĂźnes
ark:/12345/141e86dc-d396-4e59-bbc2-4c3bf5326152
ark:/12345/141e86dcd3964e59bbc24c3bf5326152
identifient la mĂȘme chose. La raison de cette fonctionnalitĂ© est que les processus de formatage de texte utilisĂ©s Ă travers le monde introduisent rĂ©guliĂšrement des traits dâunion supplĂ©mentaires dans les identifiants, rompant ainsi les liens avec tout serveur qui considĂšre les traits dâunion comme signifiants.
Les ARK distinguent majuscules et minuscules, ce qui permet des identifiants plus courts (52 contre 26 lettres par caractĂšre). La « mĂ©thode ARK » consiste toutefois Ă nâutiliser que des minuscules, sauf si vous avez besoin dâARK plus courts. Cette restriction facilite la prise en charge de vos ARK par les rĂ©solveurs sâils sont reçus avec des majuscules ou des majuscules et minuscules mĂ©langĂ©es, ce qui arrive malheureusement souvent Ă cause de lâidĂ©e, vieille de 50 ans, selon laquelle les identifiants sont insensibles Ă la casse. Vous pouvez Ă©galement envisager dâutiliser le rĂ©pertoire de caractĂšres de lâoutil Noid, qui crĂ©e des chaĂźnes protĂ©gĂ©es contre une retranscription fautive Ă lâaide de lâalgorithme de contrĂŽle le plus puissant. Ce rĂ©pertoire comprend uniquement des chiffres et des consonnes moins âlâ (lettre « L », souvent confondue avec le chiffre 1) :
bcdfghjkmnpqrstvwxz0123456789
Pour lâattribution, une stratĂ©gie courante consiste Ă tirer parti des identifiants hĂ©ritĂ©s. Par exemple, un numĂ©ro de spĂ©cimen de papillon de musĂ©e, cd456f9_87, pourrait ĂȘtre publiĂ© sous lâARK ark:/12345/cd456f9_87. Certains identifiants hĂ©ritĂ©s devront peut-ĂȘtre ĂȘtre modifiĂ©s compte tenu des restrictions de caractĂšres ARK. La deuxiĂšme stratĂ©gie couramment utilisĂ©e consiste Ă crĂ©er des chaĂźnes entiĂšrement nouvelles pour vos ARK. Dans ce cas, il est important de considĂ©rer si elles doivent ĂȘtre totalement ou partiellement opaques, ou signifiantes.
Les chaĂźnes de caractĂšres dâidentifiants pĂ©rennes sont gĂ©nĂ©ralement opaques et rĂ©vĂšlent dĂ©libĂ©rĂ©ment peu de choses sur ce Ă quoi elles sont attribuĂ©es, car les identifiants non opaques ne vieillissent pas ou ne voyagent pas bien. Les noms dâorganisations sont connus pour ĂȘtre transitoires, raison pour laquelle les NAAN sont des nombres opaques. Lorsque les dates et les titres sont corrigĂ©s, que les significations des mots Ă©voluent (par exemple, dâanciens sigles innocents peuvent devenir offensants ou attentatoires), les chaĂźnes de caractĂšres censĂ©es ĂȘtre pĂ©rennes peuvent gĂ©nĂ©rer de la confusion ou poser un problĂšme politique. La gĂ©nĂ©ration et lâattribution de chaĂźnes de caractĂšres complĂštement opaques comportent Ă©galement des risques ; ainsi, des nombres attribuĂ©s sĂ©quentiellement rĂ©vĂšlent des informations sur leur date et les chaĂźnes de caractĂšres contenant des lettres peuvent gĂ©nĂ©rer fortuitement des mots (câest pourquoi le rĂ©pertoire de caractĂšres recommandĂ© ne comporte pas de voyelles).
non-opaque | Netscape Permanent Archive | Gay_Divorcee_1934_April_1 | Name-to-Thing Resolver |
opaque-ish | x0001, x0002, âŠ, x9998 | GD/1934/04/01 | n2t.net |
opaquer | 141e86dc-d396-4e59-bbc2-4c3bf5326152 | 19340401 | n2t |
opaquest | 141e86dcd3964e59bbc24c3bf5326152 | h8k74926g | 12148 |
Il nâest pas obligatoire que les ARK soient opaques, mais il est recommandĂ© que le nom de base de lâobjet le soit, car il constitue en gĂ©nĂ©ral le nom du sujet principal de lâeffort de pĂ©rennisation. Si des qualificatifs suivent ce nom, il est moins important quâils soient opaques. Pour vous aider Ă dĂ©terminer votre niveau dâopacitĂ©, vous pouvez Ă©valuer la compatibilitĂ© avec les identifiants hĂ©ritĂ©s et la facilitĂ© de gĂ©nĂ©ration et de retranscription de la chaĂźne de caractĂšres (en prenant en compte la compacitĂ©, le caractĂšre de contrĂŽle). De nouvelles chaĂźnes de caractĂšres peuvent ĂȘtre gĂ©nĂ©rĂ©es avec la date et lâheure, un UUID, Ă lâaide dâun gĂ©nĂ©rateur de nombres ou du gĂ©nĂ©rateur Noid (Nice Opaque Identifiers).
Les chaĂźnes de caractĂšres opaques sont « muettes » et donc difficiles Ă gĂ©rer, câest pourquoi les ARK ont Ă©tĂ© conçus pour ĂȘtre des identifiants « parlants ». Cela signifie que sâil existe des mĂ©tadonnĂ©es sur la ressource, un ARK qui se prĂ©sente sur votre serveur suivi de lâinflexion « ? » devrait pouvoir parler de lui-mĂȘme.
Tout dâabord, dĂ©terminez ce que sera lâexpĂ©rience utilisateur lors de lâaccĂšs par vos ARK : une feuille de calcul, un PDF, une image, une page dâaccueil affichant des mĂ©tadonnĂ©es et plusieurs options ? Quel que soit votre choix, prĂ©voyez que votre serveur retourne des mĂ©tadonnĂ©es si lâARK arrivait suivi dâune inflexion « ? ».
Pour le reste, rĂ©soudre des ARK revient Ă rĂ©pondre Ă des URL. Normalement, les URL entrants appellent (ou sont associĂ©s Ă ) du contenu renvoyĂ© par votre serveur Web. Si votre serveur est compatible ARK, les ARK entrants (exprimĂ©s sous forme dâURL) doivent ĂȘtre associĂ©s au mĂȘme contenu. Lâapproche habituelle consiste Ă associer lâARK Ă lâURL Ă lâaide dâune table de donnĂ©es que vous mettez Ă jour chaque fois que lâURL change. Dans ce cas, votre serveur agit comme un rĂ©solveur local. Si vous ne souhaitez pas lâimplĂ©menter vous-mĂȘme, il existe des outils et services logiciels ARK qui peuvent vous aider.
Une autre approche consiste Ă laisser votre serveur Web fonctionner en lâĂ©tat et, au lieu de mettre Ă jour ses tables locales, de maintenir des tables de correspondance ARK/URL sur un rĂ©solveur distinct. Cette approche est adoptĂ©e par nombre dâĂ©diteurs de logiciels et par les organisations maintenant leurs tables via le service EZID (qui est liĂ© au rĂ©solveur n2t.net et met Ă jour les tables de rĂ©solution de ce dernier).
On prĂ©fĂ©rera la forme URL (https ou http) de lâARK. Par exemple : https://n2t.net/ark:/99166/w66d60p2. Un ARK destinĂ© Ă un usage externe est gĂ©nĂ©ralement publiĂ© (annoncĂ©, diffusĂ©âŠ) de cette maniĂšre afin de constituer un identifiant actionnable. Si un affichage visuel plus compact est nĂ©cessaire, il doit ĂȘtre associĂ© Ă un lien hypertexte. Par exemple :
<a href="https://n2t.net/ark:/99166/w66d60p2">ark:/99166/w66d60p2</a>
Une dĂ©cision importante consiste Ă dĂ©terminer si vos URI ARK utiliseront le nom dâhĂŽte de votre rĂ©solveur local ou le rĂ©solveur N2T.net. Si vous privilĂ©giez le contrĂŽle ou la stratĂ©gie de marque, vous prĂ©fĂ©rerez publier des ARK utilisant votre rĂ©solveur local. Si vous doutez de la stabilitĂ© de votre nom dâhĂŽte local, vous prĂ©fĂ©rerez publier vos ARK en utilisant le nom dâhĂŽte n2t.net (voir ici des exemples des deux approches).
Quelle que soit la maniÚre dont vous les publiez, la résolution de vos ARK via N2T est toujours possible.
Voici une liste partielle dâoutils logiciels de gestion dâidentifiants. Elle comprend notamment
On y mentionne également certains éditeurs de logiciels et fournisseurs de service, tels que EZID. Vous trouverez ici des informations supplémentaires sur les concepts et les bonnes pratiques.
Non, lâidentifiant ARK nâest pas une mĂ©taphore chrĂ©tienne. « ARK » a Ă©tĂ© choisi principalement comme acronyme prononçable pour « Archival Resource Key ».
Notre logo et notre acronyme Ă©voquent peut-ĂȘtre lâhistoire de lâArche de NoĂ©, commune aux religions abrahamiques de lâislam, du judaĂŻsme et du christianisme. Nous serions ravis que lâidentifiant ARK soit associĂ© Ă un rĂ©cipient fiable pour prĂ©server des objets prĂ©cieux.
N2T.net est un rĂ©solveur ARK global. N2T, qui signifie « Nom-Ă -Objet », est en rĂ©alitĂ© un rĂ©solveur gĂ©nĂ©ralisĂ© permettant de mapper des noms Ă des objets. Il sait donc oĂč acheminer plus de 900 autres types dâidentifiants : ARK, DOI, PMID, Taxon, PDB, ISSN, etc. Si cela vous intĂ©resse, le schĂ©ma et la rĂ©ponse suivante fournissent plus de dĂ©tails.
La rĂ©solution commence lorsquâun utilisateur tente dâaccĂ©der Ă une URL (par exemple, en cliquant sur un lien) composĂ©e de « https://n2t.net/ » suivi de lâidentifiant (nom) Ă rĂ©soudre. Comme pour tout rĂ©solveur, personne ne sait Ă lâavance â ni lâutilisateur, ni le navigateur web, ni N2T lui-mĂȘme â si la rĂ©solution rĂ©ussira. Cela dĂ©pend des informations que N2T obtient sur lâidentifiant reçu.
Une fois la rĂ©solution terminĂ©e, lâutilisateur ne sâen rend souvent pas compte, Ă moins dây prĂȘter attention (par exemple, il remarque que le lien dans la barre dâadresse est diffĂ©rent de celui sur lequel il a cliquĂ©). La rĂ©solution est conçue pour se produire sans que lâutilisateur ne sâen aperçoive.
Lorsquâune demande de rĂ©solution provient du grand public, N2T recherche lâidentifiant et redirige le lien dâorigine vers un lien de transfert. Pour ce faire, il utilise deux « modĂšles » de rĂ©solution diffĂ©rents. Pour commencer, N2T tente de rĂ©soudre le problĂšme en fonction des informations contenues dans un identifiant individuel stockĂ©. Ă dĂ©faut, il tente de rĂ©soudre le problĂšme selon les rĂšgles de classe stockĂ©es, en fonction du type dâidentifiant.
N2T stocke un type de donnĂ©es diffĂ©rent pour chaque modĂšle. Il stocke dâabord les enregistrements individuels dâenviron 50 millions dâidentifiants dâobjet (par exemple, ARK, DOI) obtenus auprĂšs de trois sources : EZID.cdlib.org, Internet Archive et YAMZ.net. Lorsque ces enregistrements incluent une URL de redirection (target) et des mĂ©tadonnĂ©es descriptives, N2T peut agir sur les inflexions, ainsi quâeffectuer le suffix passthrough et la « nĂ©gociation de contenu ». Pour prendre en charge la crĂ©ation et la maintenance dâenregistrements dâidentifiants individuels, une API N2T nĂ©cessite des identifiants de connexion. LâAPI permet Ă©galement des opĂ©rations par lots et la gĂ©nĂ©ration dâidentifiants uniques.
DeuxiĂšmement, mĂȘme si N2T ne connaĂźt rien dâun identifiant individuel, la rĂ©solution peut fonctionner grĂące Ă un enregistrement de rĂšgle de routage stockĂ© et dĂ©clenchĂ© par le type dâidentifiant. N2T conserve plus de 3 500 enregistrements de rĂšgles rĂ©guliĂšrement mis Ă jour Ă partir de plusieurs sources, notamment le registre NAAN, une base de donnĂ©es dâĂ©paules ARK et DOI et un partenariat formel sur les identifiants compacts avec identifiers.org.
La plupart des ARK sont créés par des organisations qui les publient en utilisant leur propre résolveur. Par exemple, cet ARK a été publié en spécifiant le résolveur ark.bnf.fr :
http://ark.bnf.fr/ark:/12148/btv1b8449691v/f29
Avoir Ă gĂ©rer et Ă maintenir son propre rĂ©solveur est la contrepartie dâune autonomie complĂšte. Lâutilisation de votre propre rĂ©solveur vous permet Ă©galement de mettre en avant votre « marque » via le nom dâhĂŽte, lâinconvĂ©nient Ă©tant que les marques sont transitoires et ont tendance Ă fragiliser les identifiants. Les pressions politiques voire lĂ©gales (par exemple, sur les marques commerciales) peuvent rendre difficile le maintien de noms dâhĂŽtes de « marque » plus anciens, et donc des identifiants sur lesquels ils ont Ă©tĂ© construits. Câest un autre argument en faveur du rĂ©solveur ARK global. Les utilisateurs rencontrant ultĂ©rieurement un identifiant brisĂ© et constatant que son nom dâhĂŽte nâexiste plus peuvent, si câest un ARK, extraire son identitĂ© immuable de base (lâĂ©lĂ©ment commençant par « ark: ») et la prĂ©senter au rĂ©solveur global n2t.net,
https://n2t.net/ark:/12148/btv1b8449691v/f29
Oui, et ce pour deux raisons principales. Tout dâabord, si vos ARK « Ă lâĂ©tat sauvage » apparaissent sans votre le nom dâhĂŽte de votre rĂ©solveur (câest-Ă -dire, sâils commencent par « ark: ⊠», ce qui nâest pas rare), la personne qui veut les utiliser nâest pas tenue de connaĂźtre le nom dâhĂŽte : il lui suffit dâajouter « n2t.net » devant eux. Cela fonctionne car N2T connaĂźt le nom dâhĂŽte du rĂ©solveur.
DeuxiĂšmement, si certaines organisations et leurs noms dâhĂŽtes rĂ©solveurs ont une longue durĂ©e de vie, la plupart ne durent pas. Une personne essayant dâutiliser un ARK contenant un nom dâhĂŽte de rĂ©solveur non fonctionnel peut remplacer la partie non fonctionnelle par « n2t.net ». Si les circonstances vous obligent Ă changer votre rĂ©solveur, cette Ă©tape de remplacement donne aux ARK que vous avez publiĂ©s avant le changement une meilleure chance de fonctionner.
Pour Ă©viter de futurs dĂ©sagrĂ©ments, certaines organisations qui gĂšrent leurs propres rĂ©solveurs peuvent choisir dâemblĂ©e de prĂ©fĂ©rer au nom de leur rĂ©solveur le nom de domaine n2t.net pour la publication de leurs ARK.
Lorsque le besoin dâun rĂ©solveur ARK global est apparu, les principes de base dâouverture et de gĂ©nĂ©ricitĂ© ont dissuadĂ© les concepteurs de crĂ©er un autre silo sur le modĂšle de DOI / Handle / PURL. Au lieu de quoi, le rĂ©solveur ARK a Ă©tĂ© conçu pour ĂȘtre un rĂ©solveur gĂ©nĂ©rique, non liĂ© Ă un format, appelĂ© N2T (Name-to-Thing), qui rĂ©sout maintenant plus de 600 types dâidentifiants, y compris les ARK, les DOI, les Handle, les PURL, les URN, les ORCID, les ISSN, etc. La rĂ©solution consiste Ă rechercher dans une table une chaĂźne de caractĂšres dâidentifiant, quel que soit son type, et Ă la rediriger au bon endroit.
Les mĂȘmes principes de base ont guidĂ© la conception dâun outil antĂ©rieur appelĂ© noid, conçu pour les ARK, mais Ă©galement utilisĂ© rĂ©guliĂšrement par les organisations attribuant des Handle.
En bref, le transfert de suffixe est une fonctionnalitĂ© de N2T. Supposons que vous nâayez quâun seul ARK enregistrĂ©, https://n2t.net/ark:/12345/6789, et quâil redirige vers la page du serveur Web,
https://a.example.org/dataset542
Et supposons que ce mĂȘme serveur serve Ă©galement ces pages :
https://a.example.org/dataset542/volume3
https://a.example.org/dataset542/volume3/part2
https://a.example.org/dataset542/volume3/part2.pdf
Ce que fait le transfert de suffixe est de laisser votre ARK enregistré agir comme si vous aviez également enregistré ces trois ARK ci-dessous, qui seraient résolus par les pages ci-dessus, respectivement:
https://n2t.net/ark:/12345/6789/volume3
https://n2t.net/ark:/12345/6789/volume3/part2
https://n2t.net/ark:/12345/6789/volume3/part2.pdf
Dans ce cas, le transfert de suffixe vous Ă©vite dâavoir Ă conserver des enregistrements pour trois pages supplĂ©mentaires. En fait, cela fonctionne pour un nombre illimitĂ© de pages.
ARK ANATOMY
 Resolver Service  Base Object Name  Qualifiers
  __________________ _________________ _____________
 /         \/     ...   \/       \
 https://example.org/ark:/12345/x54xz321/s3/f8.05v.tiff
     \_________/ \__/ \___/ \______/\____/\_______/
        |    |   | ... |   |    |
        |   Label  |  |  | Sub-parts Variants
        |       |  |  |
Name Mapping Authority (NMA) |  | Assigned Name   ...
               |  +---------- Shoulder: /x5
       Name Assigning Authority Number (NAAN)
Oui, les ARK peuvent ĂȘtre attribuĂ©s Ă nâimporte quel niveau de granularitĂ©, tel quâun manuscrit, des chapitres Ă lâintĂ©rieur, des sections de chapitre, des sous-sections, etc. Un ARK peut Ă©galement ĂȘtre attribuĂ© Ă une chose qui contient dâautres choses. Dans les ARK, le caractĂšre â/â est rĂ©servĂ© pour aider lâutilisateur Ă dĂ©couvrir la relation de composition. Par exemple, le premier objet ci-dessous contient le second :
ark:/12148/btv1b8449691v
ark:/12148/btv1b8449691v/f29
Câest le qualificatif de granularitĂ©. Il nây a quâun seul autre qualificatif ARK, qui indique les variantes de forme dâune chose en utilisant le caractĂšre rĂ©servĂ© â.â devant un suffixe. Par exemple, ces ARK identifient des documents,
ark:/12148/btv1b8449691v/f29.pdf
ark:/12148/btv1b8449691v/f29.html
Comme ils ne diffĂšrent que par le suffixe .pdf ou .html, on peut en dĂ©duire quâils identifient deux formes diffĂ©rentes du mĂȘme document.
Lâobjectif principal est dâĂ©viter les conflits dâattribution. En obtenant un NAAN, une organisation obtient le droit exclusif de crĂ©er des ARK « sous » ce NAAN, qui fait partie dâun prĂ©fixe placĂ© devant tous ses ARK. Lâensemble des ARK que vous pouvez crĂ©er est infini et constitue lâespace de noms de votre NAAN. Cet espace est un sous-espace de noms (sous-ensemble) de lâespace de noms ARK (lâensemble de tous les ARK possibles). Par exemple, lâespace de noms NAAN des Archives Internet regroupe tous les ARK commençant par « ark:/13960/ ». Les NAAN subdivisent lâespace de noms ARK en sous-espaces de noms distincts, chacun contenant un nombre infini dâARK possibles. Puisque les organisations ne crĂ©ent des ARK que dans leurs propres espaces de noms, les attributions dâARK entre organisations nâentreront jamais en conflit.
Les NAAN jouent Ă©galement un rĂŽle essentiel dans la rĂ©solution des conflits. Par exemple, si le rĂ©solveur N2T.net ne trouve pas dâARK entrant dans sa base de donnĂ©es, il examine le NAAN entrant et le redirige vers le rĂ©solveur local enregistrĂ© auprĂšs du NAAN. Tout rĂ©solveur local peut ĂȘtre configurĂ© pour renvoyer la faveur aux ARK entrants contenant des NAAN quâil ne connaĂźt pas, simplement en les redirigeant vers N2T.
Tous les NAAN doivent ĂȘtre enregistrĂ©s auprĂšs de N2T et rĂ©pertoriĂ©s dans le registre NAAN public, qui rĂ©pertorie Ă©galement le rĂ©solveur officiel de chaque NAAN.
Ils fonctionnent de la mĂȘme maniĂšre que tous les autres espaces de noms. Ătant donnĂ© un prĂ©fixe associĂ© Ă un espace de noms, ce prĂ©fixe peut ĂȘtre « étendu » (en ajoutant des caractĂšres Ă sa fin) pour crĂ©er un nouveau sous-espace de noms (directement en dessous) associĂ© au prĂ©fixe Ă©tendu. Si les prĂ©fixes Ă©tendus nâentrent pas en conflit, les noms des espaces de noms associĂ©s ne le seront pas non plus. Un espace de noms peut ĂȘtre associĂ© Ă nâimporte quel prĂ©fixe, chacun pouvant comporter un nombre potentiellement infini de noms (ARK) commençant par lui.
Ensemble de tous les ARK commençant par |
Espace de noms associĂ© | Exemple dâARK dans cet espace de noms |
ark:/ | Tous les ARK | ark:/99999/fk4gt2m |
ark:/12345/ | ARK sous le NAAN 12345 | ark:/12345/p987654 |
ark:/12345/x5 | ARK sous le 12345/x5 shoulder | ark:/12345/x5wf6789 |
ark:/12345/x5wf6789/ | ARK sous le 12345/x5wf6789 objet | ark:/12345/x5wf6789/c2/s4.pdf |
Le tableau ci-dessus prĂ©sente des exemples de quatre niveaux dâespaces de noms/sous-espaces de noms courants. Le premier concerne tous les ARK et le second tous les ARK sous ark:12345. Le troisiĂšme est le concept du shoulder, dĂ©crit ci-dessous, qui est la subdivision suivante du NAAN ; notez quâil nâest pas suivi de « / ».
Le quatriĂšme exemple, un ARK complet comme prĂ©fixe, montre quâun objet ARK est lui-mĂȘme un espace de noms, avec une infinitĂ© de « sous-ARK » qui pourraient en dĂ©river pour nommer des parties et des variantes dâobjets. CrĂ©er de nouveaux espaces de noms pour Ă©viter les conflits de noms est une pratique ancienne. Par exemple, une famille peut dĂ©signer quelquâun comme Sam, la communautĂ© comme Sam Smith, le gouvernement comme Sam Smith, 4321 Main Street, Springfield, et lâhistoire comme Sam Smith, 4321 Main Street, Springfield, 1888-1997.
Un shoulder (jargon empruntĂ© Ă la serrurerie) est un sous-espace de noms sous un NAAN. Câest lâensemble de tous les ARK commençant par une extension courte et fixe du NAAN. Par exemple, dans
ark:/12345/x5wf6789/c2/s4.pdf
le shoulder, /x5, Ă©tend le NAAN, 12345. La dĂ©signation courte, /x5, nâest pas unique dans de nombreux contextes ; il convient donc dâutiliser la dĂ©signation entiĂšrement qualifiĂ©e et unique au monde (par exemple, ark:/12345/x5). Dans la tradition classique des espaces de noms, le shoulder est lâensemble de tous les ARK possibles commençant par le nom de le shoulder. Notre utilisation de ce terme est empruntĂ©e Ă la serrurerie, qui comprend les jeux de clĂ©s comme Ă©tant dĂ©finis par des « shoulders » fixes et invariables prĂ©cĂ©dant les « lames » variables (formes qui diffĂšrent selon les clĂ©s partageant le mĂȘme shoulder) qui le suivent.
Les shoulders aident Ă organiser un espace de noms NAAN sur le long terme. Ce nâest pas parce quâun espace de noms contient un nombre infini dâARK possibles quâil est facile de trouver un ARK non attribuĂ©, en particulier lorsquâau fil du temps, il existe â ou a existĂ©, ou pourrait exister â diffĂ©rentes opĂ©rations dâattribution dâARK indĂ©pendantes sous celui-ci. Tout comme la communautĂ© ARK met de cĂŽtĂ© les espaces de noms NAAN des organisations, chaque organisation est encouragĂ©e Ă mettre de cĂŽtĂ© des sous-espaces de noms de shoulder. Si vous nâutilisez pas les shoulders dĂšs le dĂ©but, mĂȘme pour un simple flux dâaffectations, vous risquez de crĂ©er un chaos lĂ©ger mais permanent dans votre espace de noms NAAN, et vous risquez de demander un NAAN supplĂ©mentaire (ce qui est dĂ©conseillĂ©) pour les futurs flux dâaffectations.
Un shoulder est comparable Ă une chambre dâamis dans votre maison. Imaginez une collĂšgue, Sally, qui hĂ©berge un locataire de longue date, Larry. Bien que son logement soit extrĂȘmement spacieux (en fait, il est infini), Sally se plaint que Larry laisse traĂźner des objets en permanence dans toute la maison : son manteau sur la chaise de la cuisine, ses verres sur la table Ă manger, un livre sur son bureau, des pantoufles prĂšs du canapĂ©, une tasse de cafĂ© sur le lavabo de la salle de bain, etc. Selon les termes de son contrat de logement, les affaires de Larry, une fois placĂ©es, ne peuvent plus ĂȘtre dĂ©placĂ©es. Mais Sally, qui a Ă©galement besoin de place pour ses affaires et pourrait accueillir de nouveaux locataires plus tard, est obligĂ©e de constamment observer et de ne pas dĂ©ranger les affaires de Larry dans les parties de la maison quâelle utilise souvent.
Comprenant les difficultĂ©s de Sally, vous pourriez exiger de chacun de vos invitĂ©s quâils acceptent de ne dĂ©poser leurs affaires que dans leur chambre (leur shoulder). GrĂące Ă un tel accord, non seulement le domicile de Sally aurait Ă©tĂ© peu perturbĂ© par les affaires de Larry, mais elle aurait Ă©galement pu accueillir autant de nouveaux locataires (nouvelles opĂ©rations dâaffectation) que nĂ©cessaire dans le cadre dâaccords similaires.
Les shoulders permettent donc de dĂ©lĂ©guer lâaffectation dâARK sous un NAAN Ă des projets ou divisions autonomes, tout comme les NAAN le font sous lâespace de noms ARK global. MĂȘme si une organisation nâa initialement besoin de crĂ©er des ARK que pour un seul projet, les plans peuvent Ă©voluer. Si dâautres besoins dâARK apparaissent ultĂ©rieurement, rĂ©server un nouveau shoulder pour chaque nouveau projet ou division permet de garantir facilement lâabsence de conflit entre les flux dâaffectation indĂ©pendants (prĂ©sents, passĂ©s ou futurs), grĂące Ă des espaces de noms non chevauchants. (Les shoulders peuvent Ă©galement attĂ©nuer le problĂšme de division des espaces de noms.) Pour en savoir plus sur les shoulders, veuillez consulter la brĂšve FAQ sur les shoulders ARK.
Oui, car il existe quatre NAAN partagĂ©s avec une sĂ©mantique particuliĂšre dont vous pourriez vouloir tirer parti. Normalement, les ARK Ă long terme et leurs NAAN devraient ĂȘtre opaques, rĂ©vĂ©lant peu de choses sur leur affectation, mais la sĂ©mantique du tableau ci-dessous est considĂ©rĂ©e comme suffisamment immuable pour ne pas compromettre leur pĂ©rennitĂ©. Chaque NAAN partagĂ© possĂšde des connotations particuliĂšres que les logiciels et les personnes suffisamment formĂ©es peuvent reconnaĂźtre et exploiter, ce qui offre un certain soulagement face Ă la difficultĂ© dâutiliser des identifiants opaques.
Les NAAN partagĂ©s nâappartiennent Ă aucune organisation. CrĂ©er des ARK sans conflit sous un NAAN partagĂ© nĂ©cessite, comme vous pouvez lâimaginer, de rĂ©server un shoulder, ce qui nĂ©cessite de remplir un formulaire en ligne pour demander un shoulder sous un NAAN partagĂ© (veuillez ne pas utiliser ce formulaire pour les shoulders sous votre propre NAAN non partagĂ©).
NAAN partagé signification |
Objectif, signification ou connotation des ARK avec ce NAAN. (Il est acceptable que ces NAAN soient non opaques, car leur signification est immuable.) |
Prévision de résolution ? | Référence à long terme ? |
12345 exemples | Exemples dâARK apparaissant dans la documentation. Ils pourraient ĂȘtre rĂ©solus, mais aucun vĂ©rificateur de liens nâa Ă sâinquiĂ©ter sâils ne le sont pas. Ils ne devraient pas ĂȘtre considĂ©rĂ©s comme viables pour une rĂ©fĂ©rence Ă long terme. | peut-ĂȘtre | non |
99152 termes | ARK pour les termes de vocabulaire contrĂŽlĂ© et dâontologie, tels que les noms dâĂ©lĂ©ments de mĂ©tadonnĂ©es et les valeurs de liste de sĂ©lection. Ils devraient ĂȘtre rĂ©solus en dĂ©finitions de termes et conviennent Ă une rĂ©fĂ©rence Ă long terme. | oui | oui |
99166 agents | ARK pour les personnes, les groupes et les institutions en tant quâ« agents » (acteurs, tels que les crĂ©ateurs, les contributeurs, les Ă©diteurs, les interprĂštes, etc.). Elles doivent correspondre aux dĂ©finitions dâagent et conviennent Ă une rĂ©fĂ©rence Ă long terme. | oui | oui |
99999 test ids |
ARK Ă des fins de test, de dĂ©veloppement ou dâexpĂ©rimentation, souvent Ă grande Ă©chelle. Elles peuvent ĂȘtre rĂ©solues, mais aucun vĂ©rificateur de liens nâa Ă sâinquiĂ©ter si ce nâest pas le cas. Elles ne doivent pas ĂȘtre considĂ©rĂ©es comme viables pour une rĂ©fĂ©rence Ă long terme. | peut-ĂȘtre | non |
Les ARK 99999 et 12345 (« non rĂ©els ») sont particuliĂšrement utiles si vous ĂȘtes chargĂ© de vĂ©rifier les rapports de liens brisĂ©s. Sauf indication contraire, les erreurs des ARK contenant ces NAAN peuvent ĂȘtre ignorĂ©es. Cela permet dâĂ©viter bien des efforts inutiles, car malgrĂ© tous les efforts des fournisseurs, ces ARK non rĂ©els disparaissent souvent Ă la vue de tous. Les destinataires (par exemple, les personnes et les vĂ©rificateurs de liens) normalement concernĂ©s par les liens brisĂ©s nâont quâĂ reconnaĂźtre ces deux NAAN spĂ©cifiques pour Ă©viter dâĂȘtre distraits par eux. (Notez que la sĂ©mantique non rĂ©elle demeure mĂȘme si les objets nâexistent pas.)
Vous pouvez demander une modification de lâentrĂ©e de registre dâun NAAN relatif Ă votre organisation en remplissant le mĂȘme formulaire en ligne que celui utilisĂ© pour demander un nouveau NAAN. Pour des raisons de sĂ©curitĂ©, les demandes sont traitĂ©es manuellement. Voici quelques exemples de motifs de modification :
Voici les principaux types (ou schĂ©mas) dâidentifiants persistants.
Ils ont également une structure trÚs similaire, comme le montrent les exemples ci-dessous, composée de quatre parties :
https://n2t.net/ark:/99999/12345 https://doi.org/11.99999/12345 https://handle.net/10.99999/12345 https://purl.org/99999/12345 https:///urn:99999:12345 |
 | 1. le protocole (https:// ) plus un nom dâhĂŽte,2. juste pour ARK et URN, il y a aussi une Ă©tiquette (âark:â ou âurn:â), 3. lâautoritĂ© dâattribution du nom ( 99999 , 10.99999 ou 99999 ), qui est lâorganisation ou le groupe qui a créé un identifiant particulier,4. et enfin, le nom, ou identifiant local, quâil a attribuĂ© ( 12345 ). |
Et ils ont tous peu dâeffet sur la persistance. Voir 10 mythes persistants sur les identifiants persistants.
Non, ce serait une affirmation excessive. Mais remettons ces formats dâidentifiant (types) en perspective :
Ătant donnĂ© le peu de choses que ces formats font pour vous, lorsque vous en choisissez un, vous prendrez probablement en compte des facteurs tels que le coĂ»t, le risque et lâouverture.
Les ARK sont les seuls identifiants standards, non cloisonnĂ©s et non payants que vous pouvez enregistrer et utiliser en environ 48 heures. Les DOI, les Handle et les PURL nĂ©cessitent une rĂ©solution et dâautres services exigĂ©s par leurs systĂšmes centralisĂ©s respectifs (« silos »).
Cela ne veut pas dire que la permanence est gratuite. Rendre un identifiant pĂ©renne, en tant que fournisseur, vous impose des coĂ»ts de gestion, dâhĂ©bergement, de surveillance et de redirection. Vous pouvez faire ces choses vous-mĂȘme ou avec lâaide dâun prestataire. Mais avec les ARK, comme avec les URL, vos identifiants ne vous seront pas facturĂ©s individuellement et vous ne serez pas enfermĂ©s dans un silo nâacceptant quâun type de rĂ©solution spĂ©cifique et qui refuse donc les autres identifiants.
Les ARK ont la particularitĂ© dâĂȘtre dĂ©centralisĂ©s. Bien que lâon puisse obtenir des services de rĂ©solution dâun rĂ©solveur ARK global appelĂ© n2t.net, plus de 90% des ARK dans le monde ne lâutilisent pas comme rĂ©solveur. Plus de 650 organisations enregistrĂ©es Ă travers le monde ont créé par elles-mĂȘmes environ 3,2 milliards dâARK et, Ă lâinstar des URL, personne nâa jamais payĂ© de frais pour les crĂ©er. Bien sĂ»r, les maintenir nâest pas gratuit. Conserver lâaccĂšs au contenu de maniĂšre pĂ©renne sur le long terme, quel que soit le type dâidentifiant, nâest jamais gratuit.
En rĂ©alitĂ©, cela rend les ARK plus fiables. La possibilitĂ© de supprimer est un Ă©lĂ©ment essentiel dâune saine gestion de collections. Les types dâidentifiants autres quâARK interdisent la suppression, en partant du principe que les personnes, lorsquâelles sont invitĂ©es Ă intervenir, ne commettront pas dâerreur. Les personnes aux commandes dâun outil de gestion dâidentifiants font rĂ©guliĂšrement dâune simple inadvertance humaine une erreur Ă grande Ă©chelle, mĂȘme au dĂ©but de leur engagement. En rendant la correction difficile, nous condamnons les systĂšmes Ă traĂźner ces bourdes pour lâĂ©ternitĂ©.
Bien quâils ne soient pas Ă lâabri de telles erreurs, les ARK ont le grand avantage de pouvoir ĂȘtre créés et supprimĂ©s dans lâombre, en dehors de toute publication, ou dâengagement de conservation.
Oui. Parfois, avoir deux identifiants est utile, bien que cela puisse devenir dĂ©routant quand cela se produit souvent. Beaucoup de gens commencent par attribuer des ARK Ă chaque Ă©lĂ©ment créé afin de disposer dâune rĂ©fĂ©rence stable dĂšs le dĂ©but, avant de savoir sâils souhaitent le publier ni mĂȘme le conserver.
Lâobjet et ses mĂ©tadonnĂ©es Ă©voluent conjointement, et pour le sous-ensemble dâĂ©lĂ©ments que vous souhaitez publier dans des contextes nĂ©cessitant des DOI, vous pouvez en attribuer au moment de la publication. Si votre ARK est stable et contient des mĂ©tadonnĂ©es de base, vous faites dĂ©jĂ tout le nĂ©cessaire pour obtenir un bon DOI. Câest en cela que les ARK sont adaptĂ©s aux objets Ă un stade prĂ©coce de dĂ©veloppement.
Pour gĂ©rer efficacement deux identifiants, il est recommandĂ© de crĂ©er le DOI de maniĂšre Ă ce quâil redirige vers lâARK dâorigine. Cela Ă©limine non seulement la nĂ©cessitĂ© de mettre Ă jour la redirection DOI, mais maintient Ă©galement lâARK pĂ©renne pour tous ceux qui lâont prĂ©cĂ©demment enregistrĂ© ou marquĂ© dâun signet.
Il nây a pas de rĂ©ponse simple. La question des identifiants (non les choses, mais leurs noms) est complexe, alors si vous entendez des rĂ©ponses simples ailleurs, mĂ©fiez-vous des erreurs courantes.
Aucune caractĂ©ristique dâARK, DOI, Handle, PURL ou URN ne les rend plus ou moins adaptĂ©s Ă une discipline, un domaine ou un secteur particuliers. Avec un rĂ©solveur dâidentifiants et un systĂšme de gestion, ils fournissent tous le service essentiel : la rĂ©solution (tout comme des URL correctement gĂ©rĂ©es).
Certaines considĂ©rations spĂ©cifiques Ă un type dâidentifiant sâexpliquent parfois par le fait que la rĂ©solution et la gestion de ce type sont verrouillĂ©es par un prestataire ou un fournisseur de service donnĂ©s. Par exemple, de nombreuses fonctionnalitĂ©s et restrictions de PURL ou Handle sont dĂ©terminĂ©es par leurs silos dâadministration respectifs, de mĂȘme que celles des DOI, basĂ©s sur les Handle. En revanche les DOI ont des pratiques de mĂ©tadonnĂ©es variĂ©es et Ă©volutives dâune agence dâenregistrement Ă lâautre.
Les diffĂ©rences concrĂštes que nous remarquons, sur les mĂ©tadonnĂ©es, les pages dâaccueil et lâintĂ©gration dâoutils (par exemple, les outils de publication), ne sont pas des propriĂ©tĂ©s des formats dâidentifiants en soi, mais des propriĂ©tĂ©s de rĂ©solution, de gestion et de services de citation que divers fournisseurs Ă©tendent ou limitent. Ces services sont dĂ©finis Ă leur tour par les communautĂ©s dâutilisateurs et de clients. Les services de base reposent sur une base de donnĂ©es fiable contenant chaque identifiant, ainsi que des Ă©lĂ©ments de mĂ©tadonnĂ©es (crĂ©ateur, titre, date, URL de redirection, etc.) dĂ©crivant lâobjet identifiĂ©. Les services supplĂ©mentaires incluent la vĂ©rification des liens, la dĂ©tection des doublons, la gĂ©nĂ©ration de rapports et la recherche.
Ă la naissance de lâobjet, ou mĂȘme avant. Nous nommons gĂ©nĂ©ralement nos enfants avant leur naissance, et nous appelons et nous rĂ©fĂ©rons Ă des objets au stade de la conception, parfois longtemps avant quâils ne portent leurs fruits. Selon le niveau de prĂ©cision de vos prĂ©visions, vos objets Ă naĂźtre peuvent avoir des ARK fonctionnels qui fournissent un substitut appropriĂ© et renvoient des mĂ©tadonnĂ©es riches, y compris des dĂ©clarations de permanence.
La seule mise en garde consiste Ă ĂȘtre prudent lors de la publication dâARK dont les perspectives Ă long terme sont incertaines. Certains systĂšmes de gestion dâidentifiant possĂšdent des fonctionnalitĂ©s permettant de gĂ©rer et de rĂ©soudre les identifiants non validĂ©s (par exemple, EZID dispose dâun statut « rĂ©servĂ© »). Plus il y a de personnes qui connaissent un ARK, plus il est difficile de le supprimer.
Si personne dâautre que vous ne connaĂźt un identifiant, rien ne vous empĂȘche de le supprimer ou de le retirer. Pour schĂ©matiser, un identifiant est en rĂ©alitĂ© lâaffirmation quâune chaĂźne de caractĂšres donnĂ©e est associĂ©e Ă une chose spĂ©cifique. Moins vous en parlez, plus il est facile de supprimer cette affirmation. Si vous crĂ©ez un URL et ne le partagez quâavec vos collĂšgues les plus proches, il sera beaucoup plus facile de le retirer que sâil apparaissait pendant un mois sur un site Web public, Ă partir duquel il aurait Ă©tĂ© collectĂ© par les moteurs de recherche Internet. En revanche, il est difficile de supprimer les DOI et les Handle, car une fois enregistrĂ©s et rĂ©solus, ils sont effectivement diffusĂ©s dans le monde entier.
Les ARK se comportent comme des URL à cet égard. Les fournisseurs sont libres de créer et de partager des ARK de maniÚre restreinte, auquel cas ils sont faciles à supprimer.
Cela peut surprendre, mais mĂȘme sâils sont plus largement diffusĂ©s, les ARK peuvent ĂȘtre accompagnĂ©es de dĂ©clarations de permanence qui indiquent quel niveau dâengagement â Ă©levĂ© ou bas â on garantit. Les ARK ont Ă©tĂ© conçus pour disposer dâune palette de dĂ©clarations de permanence, mais celles-ci ne sont en aucun cas exhaustives pour des identifiants et des objets qui prĂ©sentent une grande variĂ©tĂ© de « saveurs » dâengagement. Câest pourquoi on parle des ARK comme dâidentifiants de haute performance adaptĂ©s Ă la permanence plutĂŽt que comme des « identifiants pĂ©rennes ».
Enfin, les gens commettent des erreurs. Des ARK, des DOI, des Handle, des PURL et des URN sont parfois diffusĂ©s par erreur et doivent ĂȘtre retirĂ©s. Lorsque cela se produit, la meilleure option du fournisseur consiste Ă rĂ©soudre lâidentifiant retirĂ© en donnant accĂšs Ă une page « fantĂŽme » qui explique et Ă©ventuellement prĂ©sente des excuses pour le dĂ©sagrĂ©ment occasionnĂ©. Contrairement aux idĂ©es reçues, les identifiants pĂ©rennes nâoffrent aucune garantie.
On a besoin dâidentifiants avant de savoir exactement Ă quel objet ils se rĂ©fĂšrent, ou sâils font rĂ©fĂ©rence Ă quelque chose qui mĂ©rite dâĂȘtre gardĂ©. Un identifiant exigeant des mĂ©tadonnĂ©es abouties ne peut pas ĂȘtre créé au dĂ©but du dĂ©veloppement car lâobjet est mal connu. Câest pourquoi les crĂ©ateurs dâobjets attribuent presque toujours initialement des identifiants sans exigences de mĂ©tadonnĂ©es, tels que des URL ou des ARK.
En commençant par attribuer un ARK, vous bĂ©nĂ©ficiez de la possibilitĂ© de conserver lâidentifiant dâorigine de la naissance Ă la diffusion publique alors que lâobjet et ses mĂ©tadonnĂ©es Ă©voluent. De nombreux objets passent par des phases de dĂ©veloppement et de correction intensives, durant parfois plusieurs annĂ©es, au cours desquelles ils sont trop immatures pour rĂ©pondre Ă la plupart des exigences en matiĂšre de mĂ©tadonnĂ©es. NĂ©anmoins, chaque objet a besoin dâune sorte dâidentifiant, de la conception Ă la maturitĂ©, cette derniĂšre consistant en une publication et en une amĂ©lioration, ou en un abandon. Il est facile dâabandonner des ARK qui nâont pas Ă©tĂ© dĂ©voilĂ©s au public.
Comme lâobjet lui-mĂȘme, les Ă©lĂ©ments de mĂ©tadonnĂ©es ont besoin de flexibilitĂ© pour se dĂ©velopper et Ă©voluer avec le temps :
Contrairement aux DOI Crossref et DataCite, qui nĂ©cessitent des mĂ©tadonnĂ©es spĂ©cifiques (voir, par exemple, le schĂ©ma DataCite), les ARK nâexercent aucune contrainte sur ces activitĂ©s. Mieux encore, le rĂ©solveur N2T.net permet effectivement de les prendre toutes en compte.
La crĂ©ation de mĂ©tadonnĂ©es (informations supplĂ©mentaires associĂ©es Ă ou dĂ©crivant un objet) prĂ©sente plusieurs avantages essentiels. PremiĂšrement, quelle que soit la cible de lâARK - une page dâaccueil ou un fichier - les mĂ©tadonnĂ©es fournissent aux utilisateurs des informations essentielles sur lâobjet, telles que des rĂ©fĂ©rences Ă des versions plus rĂ©centes, une date de crĂ©ation, une provenance, etc. Dans le cas des ARK, les mĂ©tadonnĂ©es sont gĂ©nĂ©ralement accessibles via des inflexions.
Les mĂ©tadonnĂ©es facilitent vraiment lâutilisation dâidentifiants opaques, qui ne rĂ©vĂšlent aucun indice sur ce quâils identifient. En lâabsence de mĂ©tadonnĂ©es, vous ĂȘtes obligĂ© dâaccĂ©der Ă lâobjet lui-mĂȘme pour vous rappeler de quoi il sâagit et Ă©galement pour vous assurer que vous accĂ©dez au bon objet. De plus, la divergence entre les mĂ©tadonnĂ©es renvoyĂ©es et lâobjet consultĂ© aide tout le monde Ă dĂ©tecter des modifications ou des erreurs dâidentification.
Les mĂ©tadonnĂ©es sont adaptĂ©es aux objets aboutis et sont beaucoup moins importantes pour les objets et les identifiants immatures que pour ceux qui ont Ă©tĂ© publiĂ©s. Avoir des mĂ©tadonnĂ©es dĂ©montre la crĂ©dibilitĂ© du fournisseur et son engagement vis-Ă -vis dâidentifiants de haute performance. Tous les fournisseurs ne sont pas Ă la hauteur de cette tĂąche.
Cela nâest pas nĂ©cessairement cher. Les mĂ©tadonnĂ©es créées Ă partir de zĂ©ro peuvent ĂȘtre coĂ»teuses, mais elles sont gĂ©nĂ©ralement produites et gĂ©rĂ©es par des fournisseurs dâobjets, auquel cas elles peuvent ĂȘtre exploitĂ©es efficacement pour les identifiants. IdĂ©alement, pour une permanence maximale, les mĂ©tadonnĂ©es principales (gĂ©rĂ©es par les fournisseurs dâobjet) devraient ĂȘtre rĂ©pliquĂ©es dans des systĂšmes indĂ©pendants afin quâil soit difficile pour une personne dâaltĂ©rer de maniĂšre indĂ©tectable les associations dâidentifiants. Par exemple, les entrepĂŽts dâobjets numĂ©riques qui obtiennent des ARK et des DOI du service EZID stockent une copie de leurs mĂ©tadonnĂ©es dans EZID, qui en stocke une autre copie dans le rĂ©solveur N2T.net.
La question des mĂ©tadonnĂ©es est complexe pour tous les identifiants, pas seulement pour ARK. Il existe des milliers de normes selon les domaines et les types dâobjets, la plupart dâentre elles se recoupant tout en se contredisant, et chacune dâelles est appliquĂ©e conformĂ©ment aux pratiques locales de lâorganisation avec diffĂ©rents niveaux de conformitĂ©. Le choix ou la crĂ©ation dâune spĂ©cification pour vos mĂ©tadonnĂ©es dĂ©pend de facteurs tels que
Une interopĂ©rabilitĂ© fiable entre domaines peut sâavĂ©rer difficile, mais Dublin Core, DataCite, Schema.org et Dublin Kernel sont des spĂ©cifications de mĂ©tadonnĂ©es standard Ă envisager pour une utilisation conjointe avec ARK.
Les ARK ont Ă©tĂ© conçus pour identifier nâimporte quoi, pas seulement des choses qui sont, par exemple, publiables ou achetables. Il nâest pas naturel de modĂ©liser un fossile, un Ă©chantillon de tissu, un terme de vocabulaire ou Marie Curie comme si chacun avait un auteur, un titre, un Ă©diteur, un copyright et un prix. Au lieu de quoi, depuis 2001, un ARK est gĂ©nĂ©ralement accompagnĂ© dâun noyau de mĂ©tadonnĂ©es gĂ©nĂ©riques de quatre Ă©lĂ©ments (Dublin Kernel, inspirĂ© de Dublin Core (DC)), suivi de tout autre Ă©lĂ©ment de mĂ©tadonnĂ©e (paire attribut / valeur) que le fournisseur souhaite donner. Ce noyau de mĂ©tadonnĂ©es est structurĂ© pour rĂ©pondre aux questions suivantes : « qui ? », « quoi ? », « quand ? » et « oĂč ? » sur lâexpression ou le « rĂ©cit » dâun objet :
Il y a beaucoup Ă dire sur les mĂ©tadonnĂ©es et ARK (par exemple, sur lâapplication des Ă©lĂ©ments « qui », « quoi », « quand » et « oĂč » au contenu dâune biographie, ou comment une institution de conservation prĂ©voit de maintenir un jeu de donnĂ©es). Des recommandations supplĂ©mentaires sur les mĂ©tadonnĂ©es et ARK seront disponibles sur arks.org. Dâautres Ă©lĂ©ments sont essentiels, tels que
Une inflexion est une dĂ©sinence Ă la fin dâun mot qui exprime un changement de sens. Cela permet de dĂ©finir un mot tel que « aller » sans dĂ©finir Ă©galement « allez » et « allons ». Pour un ARK qui mĂšne Ă un objet, ajouter simplement un « ? » Ă la fin (« ? » est un exemple dâinflexion ARK) nous permet de demander des mĂ©tadonnĂ©es sans avoir Ă dĂ©finir un identifiant distinct pour les mĂ©tadonnĂ©es de lâobjet. Cette technique simple peut ĂȘtre utilisĂ©e par un humain avec un navigateur Web. Le rĂ©solveur N2T prend en charge les inflexions et la nĂ©gociation de contenu.
La nĂ©gociation de contenu pour les mĂ©tadonnĂ©es est une technique logicielle permettant de demander dâautres formats dâobjet, tels que le format PDF ou RTF dâun fichier HTML. Bien que cela nâait pas Ă©tĂ© conçu pour cela, la « nĂ©gociation de contenu » originelle Ă©tait dĂ©tournĂ©e dans certains cas pour demander des mĂ©tadonnĂ©es, en considĂ©rant curieusement que les formats de fichier souvent utilisĂ©s pour exprimer des mĂ©tadonnĂ©es ne pouvaient vĂ©hiculer que des mĂ©tadonnĂ©es et jamais des objets Ă part entiĂšre. Contrairement aux inflexions, la « nĂ©gociation de contenu pour les mĂ©tadonnĂ©es » ne fonctionne pas du tout pour les objets reprĂ©sentĂ©s dans ces formats (formats dont la liste ne cesse de sâallonger et nâest connue que par convention tacite) et nâest pas assez simple dâutilisation pour la plupart des usagers humains.
Bien que les inflexions soient gĂ©nĂ©ralement associĂ©es aux ARK, elles ne leur sont pas rĂ©servĂ©es. Contrairement aux idĂ©es reçues, les identifiants ne font rien ; ce sont leurs rĂ©solveurs qui gĂšrent ou non des fonctionnalitĂ©s. Ainsi, par exemple, les inflexions et le « transfert de suffixe » sont pris en charge par n2t.net pour tous les types dâidentifiants, mais pas par doi.org ni par handle.net (qui dispose dâune fonctionnalitĂ© similaire appelĂ©e « Template Handles ») pour aucun type dâidentifiant.
En rĂšgle gĂ©nĂ©rale, les services basĂ©s sur des formats dâidentifiant sont conçus comme des silos, ou des plates-formes fermĂ©es, gĂ©rant un type dâidentifiant particulier tel que Handle, DOI ou PURL. Chaque silo remplit les mĂȘmes fonctions principales - associer des noms (chaĂźnes de caractĂšres dâidentifiant) Ă des choses (objets ou mĂ©tadonnĂ©es). Lâexclusion de tous les types dâidentifiant, sauf un, peut aider Ă conquĂ©rir des marchĂ©s, mais elle est contre-productive et exclusive. Elle nĂ©cessite la reconstruction du mĂȘme ensemble de services pour chaque format et viole les principes de base de lâouverture.
Ă lâinverse, le rĂ©solveur N2T (Name-to-Thing) et lâinterface de gestion EZID (« identifiants simples ») ont Ă©tĂ© conçus pour gĂ©rer tout identifiant. Les efforts consacrĂ©s Ă toute nouvelle fonctionnalitĂ© peuvent ĂȘtre Ă©tendus avec profit Ă tous les types, ce qui permet une surprenante flexibilitĂ©. Par exemple, les ARK sont souvent stockĂ©s dans EZID avec des mĂ©tadonnĂ©es DOI, et chaque DOI stockĂ© dans N2T peut bĂ©nĂ©ficier des fonctionnalitĂ©s de rĂ©solution ARK telles que les inflexions et le « transfert de suffixe », qui ne sont pas disponibles via le rĂ©solveur DOI principal (doi.org).