L’engin ressemble à un instrument moderne de torture. Ses victimes : les livres. Maintenus solidement immobiles par plusieurs attaches qui s’adaptent à toutes les tailles. Une lumière éblouissante est projetée sur les pages qu’une « tête à vide » tourne une à une après les avoir décollées grâce à un jet d’air sous pression. Le supplice s’arrête là.
L’ouvrage sort indemne de ce qui n’est qu’une séance de numérisation. Mieux, en quelques minutes, son contenu est enregistré, préservé pour l’éternité de l’usure du temps et bientôt à portée de clic des internautes de la planète tout entière. Transformées en pixels, ces pages vont être ensuite traduites en caractères. Si le procédé n’en est qu’à ses balbutiements, il permet déjà de numériser un ouvrage de 300 pages en moins de huit minutes contre trois heures lorsqu’on tourne les pages manuellement au rythme de 100 pages à l’heure.

Cette machine tourne les pages en douceur, avec un soin de copiste. Elle les numérise au rythme de 300 en 8 minutes. Les livres les plus anciens peuvent être traités.
Cette machine à tourner et à numériser les pages, présentée comme la plus rapide du monde, a été conçue par une toute jeune entreprise, Kirtas, fondée en juin 2001 par Lotfi Belkhir, alors directeur au Xerox Venture Labs du célèbre Palo Alto Research Center (PARC) de Xerox. La firme, riche grâce à ses photocopieurs, est célèbre pour ses multiples inventions (la souris d’ordinateur, l’interface à fenêtres et icônes, le réseau Ethernet…). Elle l’est aussi malheureusement pour son incapacité à breveter et industrialiser nombre des innovations qu’elle a produites.
La machine à numériser les livres en est une. De 1997 à 2001, Xerox a développé un « tourne-page » automatique en exploitant sa connaissance pointue du papier et de la manipulation mécanisée. Lotfi Belkhir dirigeait ce projet. Mais, confrontée à des difficultés financières, Xerox interrompt, en mai 2001, ses recherches dans ce domaine pour se recentrer sur son « cœur de métier ». Lotfi Belkhir ne renonce pas et décide d’exploiter la licence exclusive cédée par Xerox.
« DES LIVRES AUX OCTETS »
« La tâche est immense. Il faut numériser 560 années de savoir… », rappelle le fondateur de Kirtas. Et de s’y atteler avec un slogan fort : « Déplacer le savoir des livres aux octets » (Moving knowledge from books to bytes, en anglais) car, pour la génération actuelle, « ce qui n’est pas numérisé n’existe pas ».
A 40 ans, cet Algérien émigré aux Etats-Unis en 1987 pour y obtenir un doctorat de physique se lance dans l’aventure au pire moment. « La bulle Internet venait d’exploser. Les capitaux étaient rares. » Avec l’appui de Thomas Taylor, ingénieur en chef de Kirtas après trente et un ans passés dans le traitement du papier chez Xerox, l’entreprise industrialise sa première machine, l’APT BookScan 1200. Un prix d’innovation la récompense en 2003 et les premiers prototypes sont vendus en 2004. Ils fonctionnent à 1 200 pages par heure.
Aujourd’hui, une vingtaine d’exemplaires ont été livrés à des clients comme la Northwestern University de Chicago, Logos Research Systems, spécialisé dans la Bible, Newsbank, qui numérise les documents gouvernementaux, ou la bibliothèque publique de Rochester (Etat de New York), ville où est installée Kirtas. Au 1er janvier 2006, un nouveau modèle, l’ATP BookScan 2400, doublera la cadence de numérisation. Un gain banal pour Lotfi Belkhir, spécialiste de l' »innovation radicale ». « C’est notre culture d’entreprise, précise-t-il. Nous cherchons à proposer des avancées majeures. »
De fait, l’ATP BookScan résout l’étonnante quantité de problèmes que pose la numérisation automatique d’un livre. Outre l’adaptation aux différentes tailles, au maintien en position face à l’appareil de prise de vue, deux opérations se révèlent délicates : décoller les pages et les tourner. Pour effectuer la première, Kirtas utilise un jet d’air sous pression sur les angles libres des pages.
La seconde est plus critique. Il faut saisir la feuille et la tourner sans jamais qu’elle n’en entraîne une autre. « Il faut surtout s’adapter à tous les types de papier et à tous les grammages », souligne Lotfi Belkhir. Grâce à l’expérience de Thomas Taylor, Kirtas a mis au point une tête sous vide au profil légèrement ondulé qui la rend efficace sur tous les types de papier.
Décollée par le jet d’air, la feuille est aspirée par la tête sous vide et l’ondulation qui lui est appliquée achève de la libérer de sa suivante. Le tout en douceur pour éviter toute dégradation d’ouvrages allant du tout-venant à l’incunable. « Nous pouvons traiter tous les livres dont il est possible de tourner les pages à la main », assure Lotfi Belkhir.
Sauf ceux dont les pages sont collées ou ceux dont la fragilité extrême requiert l’usage d’un support pour les manipuler. « Sur 3 millions de pages numérisées, seulement 3 ont été abîmées », indique le PDG de Kirtas, qui cite le travail réalisé avec succès par l’université de Toronto sur un livre très ancien : La Cité de Dieu de saint Augustin (1475).
Une fois transformée en image grâce à l’appareil photo numérique de 16,6 millions de pixels, la numérisation est loin d’être terminée. Il faut en effet transformer l’image couleur en noir et blanc et aborder l’étape délicate de la reconnaissance de caractères (OCR).
Pour cela, Kirtas a intégré à son logiciel BookScan Editor le système « le plus performant du marché » : celui de la compagnie russe Abbyy capable de traiter 177 langues différentes. La tâche, dont l’efficacité varie de 90 % à 100 % en fonction de la qualité graphique du texte, prend entre 1 et 4 secondes par page.
Mais l’opération peut être répartie sur plusieurs ordinateurs et être réalisée de nuit. Kirtas la pratique puisqu’elle s’est lancée dans l’offre de service de numérisation aux clients qui ne souhaitent pas acquérir une machine de 120 000 euros. Une manière pour elle de « construire un pont entre le vieux monde du papier et le nouveau monde du numérique ».
Auteur : Michel Alberganti
Source : www.lemonde.fr
En savoir plus sur Invention - Europe
Abonnez-vous pour recevoir les derniers articles par e-mail.
