Bien qu'informatisées, un nombre
important de bibliothèques ont encore certains fonds
anciens dans des
catalogues sur fiches. L'intégration de ces notices dans
leur système de gestion informatique demande un temps
considérable, donc des coûts en conséquence.
La solution retenue généralement dans ces
projets consiste à externaliser le projet à
l'étranger pour une saisie au "kilomètre". Avec le processus EZScan, élaboré
avec la Médiathèque Valais pour son projet
de recatalogage du fichier de la bibliographie valaisanne,
ngscan.com s'est donné comme objectif de réduire le temps de recatalogage
des ces anciennes fiches de manière très conséquente
et éviter ainsi l'outsourcing.
En ajoutant en plus une plus-value qualitative notable à la description bibliographique des notices. Par le processus EZScan, les
coûts - principalement en frais de personnel
- sont réduits de manière très
importante.. Nous avons pu ainsi les diminuer
d'environ 60% par rapport à des offres d'autres
sociétés proposant cette saisie au "kilomètre". EZScan vous permettra ainsi de garder la maîtrise
totale du processus à l'intérieur de votre bibliothèque. Il donnera également
la possibilité à votre personnel (augmentation
d'un temps partiel), ou du personnel externe ou en recherche d'emploi, d'avoir une
activité
rémunérée chez vous. |
- Saisie dans un fichier texte,
de la structure matières des cavaliers d'un
ancien catalogue. Cette structure peut évidemment être
à plusieurs niveaux. Les niveaux sont indiqués
par des tabulations dans le fichier.
- A cette structure matière
est ajoutée une classification numérique
et systématique, par exemple sous la forme 00001-000-000-000-000
(suivant le nombre de niveaux). Cette classification vous
permettra ensuite de reconstruire de manière automatique
la structure hiérarchique de votre catalogue. Cette
phase est prise en charge par le logiciel EZScan.
- Ces barcodes constitués
par cet indice systématique sont alors collés
sur les cavaliers des fichiers.
- Afin d'éviter
une erreur de saisie, le barcode est lu lors du lancement
du scannage d'un lot de fiches. Toutes les fiches du cavalier
sont scannées en masse. Les fichiers TIFF produits
par le scannage seront nommés par une séquence constituée du numéro
de structure (barcode du cavalier) + un numérotation incrémentielle
: -0001, 0002 etc... Un logiciel comme Photoshop
permet cette numérotation très facilement.
On retrouve ainsi sans problème la structure d'une
fiche par le nom de fichier sans le numéro séquentiel.
Nous comptons 1h1/2 pour le scannage d'un tiroir de
1200 fiches.
- Ces fichiers images passent
ensuite par une reconnaissance de caractères (OCR). La qualité
de cette phase dépendra évidemment de la qualité
du logiciel. Mais par expérience, avec la bibliographie
valaisanne, des logiciels OCR de prix très abordable
donnent des résultats tout à fait satisfaisants.
Idem pour le matériel de scannage (Canon série
DR par exemple).
- Les fichiers texte produits par
l'OCR
sont ensuite stockés dans une base de données
de votre réseau. Cette base de données
peut être soit une base que vous possédez déjà dans
votre réseau (MsSQL, Oracle, MySQL etc...), soit installée exclusivement
pour ce projet. Dans ce cas, Ngscan.com se charge de l'installation et
de la maintenance de cette base (Firebird,
opensource et donc... gratuite).
- Le logiciel EZScan finalise
le processus. En quelques clics
de souris ou appui de touches de fonctions, il reconstruit la fiche en format MARC à
partir du texte source. Les zones sont assignées
soit par une touche de fonction ou un bouton (si la
zone constitue
une ligne du fichier source), soit elle est sélectionnée
par sélection de la ligne (1 = 100,2 = 245 ,3+4 =
580 etc...), soit sélectionnée avec la souris
et assignée de la même façon (touche
de fonction ou bouton).
Suivant le formatage de la fiche,
4 clics de souris suffisent à construire la notice
MARC. Après des tests effectués sur 1200
fiches, nous avons constaté une moyenne d'une
minute par fiche pour le catalogage.
-
Le logiciel présente également l'image de
la fiche pour contrôle visuel du texte. (Nous y avons
même ajouté un fonction zoom si l'image
n'est pas assez fine).

- Pour les zones indexées,
un contrôle de présence par Z39.50 dans la base de destination
est lancé automatiquement. Si l'autorité
a été trouvée dans la base (CC de RERO
p.ex.), elle est rajoutée à la base EZScan.
Ce contrôle ne sera ensuite plus nécessaire
pour toutes les notices suivantes contenant cette autorité.
La base de référence s'enrichit ainsi automatiquement
au fur et à mesure de l'intégration de notices.
Et les contrôles deviennent d'autant plus rapides.
Le logiciel gère également les renvois.
- Pour les zones de publications
en série (580, 773), une gestion complète,
avec renvois également, est implémentée dans EZScan.
Ainsi la cote, par exemple, est récupérée
automatiquement. La gestion des changements de titre de
revues ou journaux est entièrement gérée
(contrôle par concordance d'année entre la
fiche et les années de publication - de/à
- dans la table des revues).

- Si besoin, gestion également automatisée
de la création des items (exemplaires).
- Les données de la structure
(mot matière et numéro d'indexation systématique),
sont récupérés en zone locale 980 permettant
ainsi de reconstruire virtuellement la structure du catalogue
sur fiches (interrogation sur le web par exemple).
- La notice est également
dédoublonnée sur la base de destination
(récupération de la 035 pour RERO). Seules les zones
locales + exemplaires seront alors exportées pour
être intégrées en masse par la centrale.
- Les données MARC sont
ensuite soit sauvées dans la base de données
pour intégration de masse ultérieure, soit alors
recopiées directement dans
une grille Virtua en un clic.
|