Maarch Framework, l'infrastructure d'archivage open source

L'Entreprise souhaitant mettre en place une solution de GED pour à la fois archiver et mettre à disposition ses documents de production est confrontée à une double problématique : organiser son archive afin de permettre une conservation fiable et intègre jusqu'en fin du cycle de vie du document, mais aussi faire en sorte que les images puissent être exploitées et manipulées par le plus grand nombre, et cela dans les meilleurs délais. Maarch Framework remplit ces critères d'accessibilité et de puissance, en proposant une architecture normée et performante basée sur des composants Open Source, et un modèle économique non basé sur le nombre d'utilisateurs.

1 Quels sont les besoins amenant à utiliser Maarch Framework ?

La difficulté à retrouver un document papier peut se révéler cinq fois plus coûteuse que de le produire. Le meilleur moyen d'optimiser un système de classement et de recherche documentaire est de traiter le document sous une forme digitale (dématérialisation). Ce processus est l'assurance de disposer d'un système d'information performant. Le document dématérialisé est porteur d'informations essentielles, que se soit un document administratif, bureautique ou technique il devient important de traiter ses données. Ces documents, intégrés dans une application de gestion électronique de documents facilitera le travail des services au sein d'une entreprise ou d'une administration.

L'impact de la mise en place d'un tel système se mesure par :

  • Un accroissement de la productivité
  • Un meilleur contrôle des flux
  • Une réduction des coûts
  • L'optimisation des ressources internes

On peut résumer l'ensemble des besoins amenant à utiliser une GED par :

  • Partager les documents en réseau, en intranet ou internet
  • Maîtriser le flux des innombrables documents papiers et électroniques reçus quotidiennement dans les organisations
  • Retrouver instantanément un contrat papier, un courrier, un bon de livraison
  • Avoir une traçabilité maximale des courriers entrants et sortants
  • Augmenter les gains de productivité en réduisant le temps consacré au traitement des processus
  • Ne plus avoir de soucis d'archives
  • Ne plus dépendre d'autres collaborateurs pour accéder aux documents disponibles
  • Supprimer la manutention et le stockage de tous les papiers (facture, BL, AR,...)
  • Répondre aux contraintes légales en matière d'archivage

La solution open source Maarch Framework dispose de tous les atouts nécessaires pour répondre à l'ensemble de ces besoins.

2 Définition de la GED et GEIDE

La gestion électronique des documents, abrégée en GED (ou encore GEIDE : Gestion Electronique de l'Information et des Documents Existants, en anglais DMS), est un système informatisé d'acquisition, classement, stockage, archivage des documents. Exemple d'utilisation : la numérisation de masse de documents papiers. La GED est un processus de finalité qui découle du cycle de vie du document. Le GED fait donc appel à des algorithmes statistiques afin de classer et retrouver les documents par pertinence.

3 Acquisition et capture du document

Il y deux modes d'acquisition possibles pour intégrer ses documents dans une GED :

  • La numérisation des documents (ou encore dématérialisation)
  • L'injection d'un document numérique

La dématérialisation par numérisation des documents de nature papier peut regrouper tous types de support, que se soit des documents papiers entrants (courriers, télécopies, spools de factures, BL, fiche de paie) ou encore des plans. Le moyen permettant de les numériser est le scanner.

Le deuxième mode d'acquisition des documents est donc l'intégration de documents de nature électroniques. Ce mode concerne les documents générés par l'ordinateur (fichiers Excel, Doc, TXT...), les emails ou encore les spools d'impression.

L'objectif de l'acquisition est l'alimentation du SI (système d'information) en documents qualifiés.

4 Traitement de l'information contenue par le document

Le document sous sa forme numérique, doit faire l'objet d'un traitement particulier afin d'en extraire la richesse d'information qu'il comporte.

4.1 Extraction de l'information

Des processus spécifiques, connectés à la Maarch Framework permettent d'extraire de façon automatisée les données présentes sur les documents.

  • LAD (Lecture automatique de documents) : reconnaissance de caractères
  • OMR (Optical mark recognition) : lecture automatique de cases à cocher et de codes à barres
  • RAD (Reconnaissance automatique de documents) : interpréter des zones sur un document (ex : facture, bulletin de paie...)

4.2 L'indexation

L'indexation constitue la description du document et de son contenu en vue de faciliter son exploitation. Cette indexation entraîne automatiquement le référencement du document au sein de la base de données du serveur central. On peut distinguer deux types d'indexation :

  • Indexation par type : description formelle du document en utilisant ses métadonnées (type, auteur, titre, source, date, etc) dont le vocabulaire est standardisé afin de permettre l'utilisation de ces métadonnées par le plus grand nombre d'outils de recherche.
  • L'indexation par concepts ou mots-clés : vise plutôt le contenu du document pour faciliter les opérations de recherche -> recenser les termes qui apparaissent le plus souvent.

Par exemple, Le logiciel de GED Maarch LetterBox (gestion numérique des courriers) prend en charge, la numérisation, la distribution via l'intranet et internet et l'archivage de tous les courriers dans l'entreprise. La traçabilité des courriers et leur confidentialité sont garanties. Le destinataire pourra alors traiter ses courriers dans les délais impartis, les faire circuler parmi ses collaborateurs. Le courrier archivé rejoint ensuite selon des critères précis la base de données de l'entreprise et pourra ainsi être consulté par d'autres utilisateurs autorisés.

5 Stockage des documents

C'est une phase importante, même critique. Les problématiques sont les suivantes :

  • Le support de stockage doit être adapté au mieux avec le volume des documents. Il doit aussi, en fonction de la fréquence de consultation et de l'importance des données, offrir des temps d'accès fiable.
  • L'organisation du stockage peut être hiérarchisée en fonction du contenu des documents (texte, vidéo, image, etc.) de leurs provenances, états, types...
  • La durée de conservation (période de rétention) doit aussi être considérée afin de permettre une épuration périodique du système, en vue de faciliter le stockage et d'alimenter les archives.

Maarch Framework propose une conservation en ligne, rendue possible par l'accroissement des capacités des disques magnétiques, et par l'évolution des méthodes de compression : un fonds d'archive de 10 millions de pages A4, occupant un espace de stockage de 2.000 mètres linéaires, occupe une fois numérisé un espace disque de seulement 600 Go.

6 Retrouver aisément ses documents

6.1 Recherche de documents

Afin de retrouver rapidement un document, deux types de recherche multi-critères sont possibles. La première porte sur les propriétés du document et ses index métiers : auteur, date de création, de révision, taille, numéro de facture... l'utilisateur peut aussi faire une recherche en texte intégral (sur le contenu du document). Le système de GED permet un affichage écran ou une impression complète du document restitué.

6.2 Classement des documents

L'intégration d'un plan de classement documentaire dans une solution GED permet de retrouver ses documents d'une manière formalisée. La solution Maarch Framework propose une arborescence type Windows à plusieurs niveaux pour retrouver aisément les documents classés. Un telle fonctionnalité permet également de gérer des dossiers.

7 La circulation du document au sein d'un groupe de travail

La diffusion d'un document est un élément essentiel au sein d'un groupe de travail.

La mise en place d'un workflow de validation du document permet de simplifier le processus de traitement et ainsi d'obtenir des gains immédiats en temps de validation.

À titre d'exemple des possibilités offertespar Maarch Framework, LetterBox propose les fonctionnalités de diffusion suivantes :

  • Diffuser les courriers aisément sans avoir besoin de faire des photocopies
  • Le(s) destinataire(s) sont avertis automatiquement de l'arrivée de nouveaux courriers
  • La gestion des listes de distribution se fait de manière intuitive et simple
  • Les tâches de traitement du courrier sont affectées automatiquement aux bonnes personnes
  • La circulation du courrier au sein du groupe de travail est totalement maîtrisée (validation, distribution...)

8 L'archivage des documents et valeur légale

La conservation des documents par l'archivage est une nécessité pour respecter les obligations légales, les usages, les règles liées aux métiers. Cet archivage dit statique, de documents « morts » permet de faire face à des demandes de tiers (bulletins de salaires, déclarations diverses, etc.) et de constituer des dossiers juridiques lors d'actions en justice.

La norme AFNOR NFZ42-013 constitue justement un modèle pour l'établissement d'un schéma de production fiable et traçable, où chaque événement est enregistré, et où les documents sont inscrits de façon irrémédiable sur leur support. Cette norme de 34 pages formalise l'enregistrement, le stockage et la restitution des documents numérisés issus des différents applicatifs métier de l'entreprise, et revêtant un caractère légal. Dans sa première version de juillet 1999, elle tolère uniquement l'archivage sur des supports de type WORM (Write Once Read Many), que seuls les supports optiques sont à même d'offrir. La révision de février 2009 a apporté un renforcement ainsi qu'un assouplissement de la norme : elle admet désormais l'archivage sur support réinscriptible sous conditions, encadre la traçabilité des archives.

Maarch répond à cette problématique grâce à son module d'export de documents numériques sur support optique et à son architecture, qui historise tous les événements de l'application.