ngscan.com 
EZScan (EZS) : Processus de recatalogage d'anciens catalogues sur fiches

Voir la démo (provisoire, le logiciel est en développement)

Définition du besoin


Bien qu'informatisées, un nombre important de bibliothèques ont encore certains fonds anciens dans des catalogues sur fiches.
L'intégration de ces notices dans leur système de gestion informatique demande un temps considérable, donc des coûts en conséquence. La solution retenue généralement dans ces projets consiste à externaliser le projet à l'étranger pour une saisie au "kilomètre".
Avec le processus EZScan, élaboré avec la Médiathèque Valais pour son projet de recatalogage du fichier de la bibliographie valaisanne, ngscan.com s'est donné comme objectif de réduire le temps de recatalogage des ces anciennes fiches de manière très conséquente et éviter ainsi l'outsourcing. En ajoutant en plus une plus-value qualitative notable à la description bibliographique des notices.
Par le processus EZScan, les coûts - principalement en frais de personnel - sont réduits de manière très importante.. Nous avons pu ainsi les diminuer d'environ 60% par rapport à des offres d'autres sociétés proposant cette saisie au "kilomètre".
EZScan vous permettra ainsi de garder la maîtrise totale du processus à l'intérieur de votre bibliothèque.
Il donnera également la possibilité à votre personnel (augmentation d'un temps partiel), ou du personnel externe ou en recherche d'emploi, d'avoir une activité rémunérée chez vous. 

Description du processus

     

    Le processus peut se résumer ainsi :

  • Saisie dans un fichier texte, de la structure matières des cavaliers d'un ancien catalogue. Cette structure peut évidemment être à plusieurs niveaux. Les niveaux sont indiqués par des tabulations dans le fichier.

  • A cette structure matière est ajoutée une classification numérique et systématique, par exemple sous la forme 00001-000-000-000-000 (suivant le nombre de niveaux). Cette classification vous permettra ensuite de reconstruire de manière automatique la structure hiérarchique de votre catalogue. Cette phase est prise en charge par le logiciel EZScan.
  • Ces barcodes constitués par cet indice systématique sont alors collés sur les cavaliers des fichiers.
  • Afin d'éviter une erreur de saisie, le barcode est lu lors du lancement du scannage d'un lot de fiches. Toutes les fiches du cavalier sont scannées en masse. Les fichiers TIFF produits par le scannage seront nommés par une séquence constituée du numéro de structure (barcode du cavalier) + un numérotation incrémentielle : -0001, 0002 etc... Un logiciel comme Photoshop permet cette numérotation très facilement. On retrouve ainsi sans problème la structure d'une fiche par le nom de fichier sans le numéro séquentiel. Nous comptons 1h1/2 pour le scannage d'un tiroir de 1200 fiches.
     
  • Ces fichiers images passent ensuite par une reconnaissance de caractères (OCR). La qualité de cette phase dépendra évidemment de la qualité du logiciel. Mais par expérience, avec la bibliographie valaisanne, des logiciels OCR de prix très abordable donnent des résultats tout à fait satisfaisants. Idem pour le matériel de scannage (Canon série DR par exemple).
     
  • Les fichiers texte produits par l'OCR sont ensuite stockés dans une base de données de votre réseau. Cette base de données peut être soit une base que vous possédez déjà dans votre réseau (MsSQL, Oracle, MySQL etc...), soit installée exclusivement pour ce projet. Dans ce cas, Ngscan.com se charge de l'installation et de la maintenance de cette base (Firebird, opensource et donc... gratuite).
     
  • Le logiciel EZScan finalise le processus. En quelques clics de souris ou appui de touches de fonctions, il reconstruit la fiche en format MARC à partir du texte source. Les zones sont assignées soit par une touche de fonction ou un bouton (si la zone constitue une ligne du fichier source), soit elle est sélectionnée par sélection de la ligne (1 = 100,2 = 245 ,3+4 = 580 etc...), soit sélectionnée avec la souris et assignée de la même façon (touche de fonction ou bouton).
    Suivant le formatage de la fiche, 4 clics de souris suffisent à construire la notice MARC. Après des tests effectués sur 1200 fiches, nous avons constaté une moyenne d'une minute par fiche pour le catalogage.
     
  • Le logiciel présente également l'image de la fiche pour contrôle visuel du texte. (Nous y avons même ajouté un fonction zoom si l'image n'est pas assez fine).
     

voir en taille réelle

  • Pour les zones indexées, un contrôle de présence par Z39.50 dans la base de destination est lancé automatiquement. Si l'autorité a été trouvée dans la base (CC de RERO p.ex.), elle est rajoutée à la base EZScan. Ce contrôle ne sera ensuite plus nécessaire pour toutes les notices suivantes contenant cette autorité. La base de référence s'enrichit ainsi automatiquement au fur et à mesure de l'intégration de notices. Et les contrôles deviennent d'autant plus rapides. Le logiciel gère également les renvois.
     
  • Pour les zones de publications en série (580, 773), une gestion complète, avec renvois également, est implémentée dans EZScan. Ainsi la cote, par exemple, est récupérée automatiquement. La gestion des changements de titre de revues ou journaux est entièrement gérée (contrôle par concordance d'année entre la fiche et les années de publication - de/à - dans la table des revues).

voir en taille réelle

  • Si besoin, gestion également automatisée de la création des items (exemplaires).
     
  • Les données de la structure (mot matière et numéro d'indexation systématique), sont récupérés en zone locale 980 permettant ainsi de reconstruire virtuellement la structure du catalogue sur fiches (interrogation sur le web par exemple).
     
  • La notice est également dédoublonnée sur la base de destination (récupération de la 035 pour RERO). Seules les zones locales + exemplaires seront alors exportées pour être intégrées en masse par la centrale.
     
  • Les données MARC sont ensuite soit sauvées dans la base de données pour intégration de masse ultérieure, soit alors recopiées directement dans une grille Virtua en un clic.
     
Accueil