Thes’envir est un nouveau thesaurus dans le domaine  de l’environnement, publié par le réseau LIEN (Lieux d’informations sur l’environnement et la nature) Languedoc-Roussillon, qui regroupe 14 structures documentaires.

Il est structuré en 18 champ sémantiques regroupant pas moins de 12000 termes (descripteurs et synonymes) :
Administration – Droit – Gestion,
Agriculture, 
Aménagement – Transport, 
Animaux, 
Atlas,
Culture – Loisirs – Patrimoines, 
Droit de l’environnement,
Ecologie,
Economie,
Education – Formation,
Energie,
Pollutions – Nuisances,
Sciences Humaines,
Sciences
Sciences de la Terre,
Sciences de la Vie,
TIC,
Végétaux.

Il est disponible en version informatique, au format XML (non normalisé) et en version "papier" avec une liste alphabétique structurée et une liste hiérarchique. La liste permutée sera éditée d’ici la fin de l’année 2009.

Pour en savoir plus : http://grainelr.org et http://www.grainelr.org/UserFiles/File/Extraits%20THES%20ENVIR%20alleges.pdf

http://www.bibnum.education.fr
Un bel exemple de bibliothèque numérique, dédiée à l’histoire des sciences, a été initié par le CERIMES (Centre de ressources et d’information multimedia pour l’enseignement supérieur), et développé par Smile

Les textes proposés sont en langue française ou des traductions françaises de textes originaux publiés dans une autre langue, courts -25 à 30 pages-, et par conséquent le plus souvent des articles de revues scientifiques.

Le site, créé avec Drupal, s’appuie sur iPaper, visionneuse de Scribd, dont le principe consiste à uploader les fichiers doc, pdf ou autre pour les transformer dans un format Flash, et par un principe de widget, insérer sur son site web le code permettant d’y donner accès dans la visionneuse. (Le principe est en fait identique à celui de YouTube pour les videos)

Le public est invité à transmettre ses suggestions de texte à intégrer à la bbliothèque, en se portant ou non volontaire pour en fournir une analyse.

Fonctionnellement, le site est riche, car il propose

  • les fonctions de lecture associées à iPaper : zoom, vue plein écran, vue mosaïque
  • analyse du texte
  • éléments bibliographiques : ouvrages critiques complémentaires
  • récupération des analyses et des textes au format pdf
  • les codes à utiliser pour « embarquer » le texte BibNum dans votre site web

Toutefois manquent dans la visionneuse les fonctions pourtant prévues par iPaper de sélection de texte et de recherche, que j’ai testées sur quelques textes et qui semblent ne pas êtres actives…. Bien dommage ! Tout en précisant que le site propose lui même ses propres outils de recherche à l’intérieur des textes.

A la suite des deux billets de présentation de CMIS 0.5, je me dois d’orienter les lectures d’approfondissement non seulement vers le standard lui-même mais également vers les pages du comité technique OASIS  (Organization for the Advancement of Structured Information Standards)- CMIS :

http://xml.coverpages.org/cmis.html : extrêmement riche en liens vers de nombreuses ressources

Bonne lecture !

Page officielle du comité technique OASIS en charge de la validaiton de la version0.5 : http://www.oasis-open.org/committees/tc_home.php?wg_abbrev=cmis

http://wiki.oasis-open.org/cmis : wiki mis en place par le comité technique OASIS

EMC (Documentum), Microsoft (Sharepoint) et IBM (Filenet) ont publié conjointement en septembre 2008 un standard pour assurer l’intéropérabilité de systèmes de gestion de contenu d’entreprise : CMIS ou Content Management Interoperability Services.
La mise en place de CMIS au niveau des progiciels nécessite l’ajout d’un connecteur basé sur des Web Services SOAP ou bein sur le protocole REST/ATOM. Aucune réécriture du code, donc.

Le langage exploité par CMIS, CMIS Query Language, s’inspire de SQL-92 grammar (ISO/IEC 9075: 1992 – Database Language SQL) et de sa syntaxe. Il permet de réaliser des jointures entre tables, des sélections de données de type « select» et des recherches plein-texte

Le standard complet dans sa version 0.5 est disponible en téléchargement :

Voici ce que contient le dossier du standard :

CMIS (1)

CMIS (1)

CMIS (2)

CMIS (2)

CMIS est composé de plusieurs parties :

  • Partie 1 [Domain model V0.5] : Introduction, General Concepts, Data Model, and Services
  • Partie 2 [REST-ATOM binding] : REST protocol binding
  • Partie 2 (suite) [Web services binding]: SOAP protocol binding

Généralités

  • CMIS définit 4 principales natures d’objets existant dans un entrepôt (référentiel) de contenu (le repository) : Document, Folder , Relationship et Policy.
  • Pour chaque nature d’objet on peut déclarer et définir des types supplémentaires ou "Object Type".
  • Chaque nature d’objet accepte un ensemble de propriétés, dont les valeurs sont fixées pour chaque objet du repository ex. Identifiant, URI, Nom etc

Les "CMIS services" fournis en plus du modèles de données permettent notamment de

  • naviguer et parcourir l’arborescence des dossiers de l’entrepôt
  • créer, lire, mettre à jour et supprimer des objets
  • créer une nouvelle version d’un document et retracer l’historiques des versions successives

CMIS spécifie également des correspondances avec SOAP et REST/ATOM pour la mise en place de connecteurs

Repository

Un repository peut gérer un certain nombre de fonctions. Le service getRepositoryInfo renvoie la liste des fonctions prises en charge. Les fonctions concernées sont

  • Multi-filing : rattachement d’un document à plusieurs dossiers
  • Unfiling : autoriser le non-rattachement d’un document
  • Version-specific filing : gérer le rattachement de chaque version d’un document à un dossier éventuellement différent
  • PWC updatable : autoriser la mise à jour des copies de travail privées
  • All versions searchable : gérer la recherche soit sur la dernière version des documents uniquement soit sur toutes
  • PWC searchable : possibilité d’inclure les copies privées dans le champ balayé par les requêtes
  • enumCapabilityQuery : gestion des requêtes soit en texte intégral uniquement, soit sur les métadonnées uniquement, soit sur les deux, soit pas de gestion de requêtes
  • Join support level in query : niveau de prise en charge des jointures (inner join, outer join…)
  • Full-text search support level in query : degré de prise en charge du texte intégral dans les requêtes (WHERE)

Objets

Documents

Les documents représentent des unités de contenu à l’intérieur de l’entrepôt.

Un document peut inclure ou non un flux de contenu, ou" content stream", et cela doit être précisé dans les définitions des objets de type Document (voir "types d’objets" ci dessous).

Les documents peuvent être versionnés.

Folder objects (répertoires ou dossiers)

Les répertoires ou dossiers sont les contenants dans lesquels des documents (ou d’autres répertoires) peuvent être déposés. Un document peut être déposé dans un ou plusieurs répertoires. A l’instar des documents les Folder objects sont interrogeables.

Il y a une relation hiérarchique implicite entre un dossier et les objets qu’il contient, avec comme contraintes d’intégrité de cette relation sa réciprocité, et l’interdiction de créer des boucles (un objet de type répertoire ne peut pas être à lui même son propre père). La suppression d’un élément de la collection associée au répertoire doit également détruire le lien hiérarchique implicite qui le rattachait à un dossier parent.

Une propriété AllowedChildObjectTypeIDs permet de définir quels sont les types d’objets autorisés comme "enfants" de chaque Folder object.
Le service removeObjectFromFolder permet de supprimer le lien père-fils entre un "Folder object" et un objet d’un autre type déclaré être son fils.

Tout répertoire a un et un seul élément père, sauf les repertoires situés à la racine du système, qui n’ont pas d’élément père.

Un répertoire racine ne peut être créé, supprimé ou déplacé via des CMIS services.

Tout nouveau répertoire créé doit se voir déclarer un "Folder object" parent, par le service addObjectToFolder.
Il est impossible de supprimer un "Folder object" dès lors qu’un objet au moins lui est associé.
Il n’est pas obligatoire en revanche d’attribuer aux autres types d’objets un "Folder object" parent.

Deux modes de fonctionnement distincts peuvent être choisis pour un entrepôt :

ou bien l’attribution d’un répertoire à un document est unique pour toutes les versions du document (version-independent : elles sont toutes stockées dans un même repertoire), ou bien elle est décidé pour chacune des versions du document (version-specific : chaque version d’un document peut être placée dans un répertoire indépendamment de ce qui a été décidée pour les versions antérieures de ce document .)

Relationships (relations)

Les relations désignent des relations très lâches entre deux 2 objets (documents ou répertoires) dans l’entrepôt. Elles peuvent avoir comme objet source ou comme objet cible des Documents, des Folders, et, selon les repositories, éventuellement des Policies.

Etablir une relation entre deux objets n’a aucune incidence sur eux. Par exemple cela n’entraîne pas un changement de version, ni de date de dernière modification. L’objet cible de la relation n’hérite pas des contraintes ni des comportements de l’objet source.

Il est autorisé de créer une relation avec le même objet comme cible et comm source de la relation.

Policy objects (Règles)

Ils gèrent les règles d’administration qui sont appliquées aux objets.

L’entrepôt CMIS peut supporter des objets de type Policy object mais cela n’est pas obligatoire. Un objet peut être soumis à une ou plusieurs règles.

Types d’objets

Les 4 objets principaux décrit ci-dessous acceptent d’être déclinés en types : types de documents, types de relations etc.

La définition de chaque type d’objet est constituée des informations suivantes

  • ObjectTypeId : ID du type d’objet
  • ObjectTypeQueryName
  • ObjectTypeDisplay : libellé du type d’objet pour l’affichage
  • NameParentTypeId :
  • RootTypeQueryName
  • Description
  • Creatable
  • Queryable
  • Controllable
  • includeInSuperTypeQuery

Pour définir des types d’objets Document on inclut également

  • Boolean
  • Fileable
  • ContentStreamAllowed

Pour définir des types d’objets Relationship on inclut également

  • AllowedSourceTypes
  • AllowedTargetTypes

Propriétés des objets

Les propriétés peuvent être mono- ou multi-valuées. Les types de données sont basés sur XML Schema Part 2: Datatypes Second Edition (28/10/2004) :

  • String (xsd:string)
  • Decimal (xsd:decimal)
  • Integer (xsd:integer)
  • Boolean (xsd:boolean)
  • DateTime (xsd:dateTime)
  • URI (xsd:anyURI)

Les quatres objets définis ci-dessus (Document, Folder, Relation et Policy) ont en commun les propriétés suivantes

  • ObjectId (ID)
  • Uri (URI)
  • ObjectTypeId (ID)
  • CreatedBy (string)
  • CreationDate (DateTime)
  • LastModifiedBy (string)
  • LastModificationDate (DateTime)
  • ChangeToken (string)

Les propriétés d’un document sont

  • Name (string)
  • IsImmutable (boolean)
  • IsLatestVersion (boolean)
  • IsLatestVersion (boolean)
  • IsLatestMajorVersion (boolean)
  • VersionLabel (string)
  • VersionSeriesId (ID)
  • IsVersionSeriesCheckedOut (boolean)
  • VersionSeriesCheckedOutBy (string)
  • VersionSeriesCheckedOutId (id)
  • CheckinComment (string)
  • ContentStreamAllowed (string)
  • ContentStreamLength (integer)
  • ContentStreamMimeType (string)
  • ContentStreamFile name (string)
  • ContentStreamUri (URI)

Les propriétés d’un dossier sont :

  • Name (string)
  • ParentID (ID)
  • AllowedChildObject TypeIds (ID)

Les propriétés d’une relation sont exclusivement :

  • sourceId (ID)
  • targetId (ID)

Les propriétés pour les règles sont :

  • Policy name (string
  • Policy text (string)

Il est possible, pour n’importe lesquels des 4 types d’objets prévus, de créer des types d’objets supplémentaires qui spécifient le schéma des propriétés autorisées ou requises pour les objets.

Les CMIS services

CMIS fournit des services CRUD (Create, Retrieve, Update, Delete) applicables aux objets.

Repository services

  • getRepositories : retourne URI, noms et IDs des repositories disponibles
  • getRepositoryInfo : retourne des informations détaillées sur un repository : ID, nom, URI, description, ID du dossier racine, nom et version du produit, versions supportées de CMIS, propriétés spéicfiques du repositoriy ex: gestion du multifiling, repositories liés
  • getTypes retourne tous les types d’objets du repository et leurs attributs
  • getTypeDefinition : retourne des propriétés détaillées d’un type d’objet déterminé
  • getAllowableActions : retourne les actions autorisées à l’utilisateur sur un objet ex. le supprimer, modifier ses propriétés, le changer de dossier etc.
  • getProperties : retourne les propriétés de l’objet et éventuellement les actions autorisées à l’utilisateur sur cet objet
  • getContentStream : retourne le flux de conteu du document

Navigation service

  • getDescendants : retourne la liste des objets de l’arborescence à partir d’un dossier déterminé, sur un ou plusieurs niveaux. Il est possible de ne demander que les objets d’un type particulier
  • getChildren : retourne les éléments situés au premier niveau sous le dossier spécifié. Si toutes les versions d’un même document sont sous un même dossier, seule la version la plus récente est renvoyée
  • getFolderParent : retourne l’ID et les propriétés du ou des dossier(s) parent(s) de l’objet de type Folder spécifié
  • getObjectParents : retourne l’ID et les propriétés du ou des dossier(s) parent(s) de l’objet non- Folder spécifié
  • getCheckedoutDocuments : retourne les objets de type Documents validés auxquels l’utilisateur à accès (en général ceux qu’il a lui-même validés)

Object service

  • createDocument : crée un objet Document du type spécifié, et éventuellement lui attribue un dossier parent
  • createFolder : crée un objet de type Folder du type spécifié
  • createRelationship : crée une relation d’un type déterminé entre deux objets
  • createPolicy : crée un objet Policy du type spécifié, et éventuellement lui attribue un dossier parent
  • updateProperties : permet de mettre à jour les propriétés de l’objet spécifié (dans CMIS 1.0 pour une propriété multivaluée il faut mettre à jour toute la liste de valeurs)
  • moveObject : permet de déplacer l’objet spécifié d’un dossier à un autre
  • deleteObject : permet de supprimer l’objet spécifié
  • deleteTree : permet de supprimer une arborescnce à partir du point (dossier) spécifié inclu.
  • setContentStream : crée ou remplace le flux de contenu associé à l’objet Document spécifié
  • deleteContentStream : supprime le flux de contenu associé à l’objet Document spécifié

Multifiling service

(valable uniquement pour les repositories qui acceptent le multifiling)

  • addObjectToFolder : placer l’objet spécifié sous un dossier
  • removeObjectFromFolder : enlver l’objet spécifié d’un ou de tous les dossiers dans lesquels il est placé

Policy service

  • applyPolicy : applique une règle à l’objet spécifié
  • removePolicy : annule l’application d’une règle à l’objet spécifié
  • getAppliedPolicies : Retourne la liste des objets Policy appliqués à l’objet spécifié

Relationship service

  • getRelationships : retourne la liste des relations de l’objet spécifié, eventuellement restreintes à celles d’un type particulier ou établie dans une direction précise (source/cible)

Versioning service

  • checkOut :
  • checkIn : fait de la copie privée la version courante du document
  • getPropertiesOfLatestVersion : retourne les propriétés de la dernière version dans la série spécifiée
  • getAllVersions : retourne la liste de toutes les versions de la série sépcifiée, triée par ordre décroissant de date de création
  • deleteAllVersions : supprime toutes les versions de la série spécifiée

La norme NF Z42-013 "Archivage électronique – Spécifications relatives à la conception et à l’exploitation de systèmes informatiques en vue d’assurer la conservation et l’intégrité des documents stockés dans ces systèmes" révisée a été homologuée par le Ministère de l’Industrie le 3 février 2009 . Elle est désormais publiée par l’AFNOR (datée de mars 2009) et disponible au prix de… 72,25 €.

Notice détaillée sur la boutique AFNOR

l’Aproged organisera de sessions de formation à l’occasion de cette révision. Le tarif est de 950,00 Euros H.T. (soit 1136,20 Euros T.T.C.) par personne incluant un exemplaire de la norme révisée  (prochaines sessions les 12/03, 09/04 et 14/05/2009)

A lire également sur le site de l’APROGED : " Economie numérique : l’authenticité des documents numériques a enfin sa norme"

A suivre : le projet de norme ISO s’appuyant les recommandations de la norme française…

Suivre

Recevez les nouvelles publications par mail.