Indexation audiovisuelle aux Archives de la Ville de Lausanne: 20 ans de mutations. Et ce n’est pas fini!
Nous vivons les débuts d’une révolution numérique dont l’effet sur la vie des humains comme leur organisation sociale et professionnelle va être à la fois rapide, perturbant et profond. En ce XXIe siècle, la reconfiguration du travail au sein des institutions place les archivistes dans une position inconfortable, qui ressemble à une course contre la montre pour réguler les conditions de structuration des masses documentaires numériques natives, en vue de leur élimination ou conservation à long terme.
Dans ce contexte, le monde audiovisuel, par ses spécificités sociétales (politiques, militaires, commerciales) et techniques originelles (temps, espace, son et sémantique interprétés par des machines), a très vite été gagné par le numérique. La désolidarisation du support physique avec le contenu de l’information qui suppose évolutivité et migrations, si elle soulève encore des réticences – notamment dans le secteur de la conservation cinématographique sur pellicule – n’est plus un objet débattu dans un milieu professionnel préoccupé jadis par le concept d’original. Aujourd’hui, l’archivage numérique, audiovisuel compris, se confronte d’abord à des exigences d’authenticité, de fiabilité, d’intégrité et d’accessibilité aux documents. Cette accessibilité est liée à de nombreux paramètres qui se combinent pour faire système, les étapes d’indexation et de communication ne pouvant plus être dissociées.
Les mutations d’une indexation
Entre le début des années 1990 et 2014, l’inventaire lausannois des sources au diovisuelles peut se résumer en trois phases.
La première phase est fondatrice: elle est marquée par la constitution d’archives audiovisuelles (sonores et filmiques) et la reconnaissance politique de cette mission au sein des Archives de la Ville de Lausanne. La deuxième phase, entre 1997 et 2010, correspond à une prise en charge active des sources audiovisuelles avec création de masters numériques sur bandes pour la vidéo et fichiers pour le son. Ce traitement était accompagné d’un inventaire sur base de données qui intégrait une segmentation des productions, permettant d’ordonner le rang de passage de chaque «chapitre» analysé. La troisième phase, dès 2011, correspond à une gestion globale de l’information audiovisuelle sous forme de fichiers numériques permet tant une indexation chronoréférencée, avec segmentation et consultation im médiate des vidéos sur un portail web (www.dartfish.tv/lausanne) moissonné par les moteurs de recherche (avec toutes les réserves que cela implique).
A chaque phase, l’octroi de ressources humaines, technologiques et financières a été décisif dans un environnement fortement contraint par les finances publiques et par le fait que ce travail s’inscrit dans une institution généraliste qui ne met donc pas les archives audiovisuelles – essentiellement de provenance privée – comme cœur de métier. Depuis 1997, l’archiviste en charge de ce secteur travaille en étroite collaboration avec les cadres du service pour définir la politique d’archivage. Un soutien est par ailleurs assuré par le service informatique de Lausanne qui met ses infrastructures de serveurs et assure connectivité et sécurité. En revanche, les Archives financent leur outil de gestion ainsi que les développements logiciels. Faute de moyens financiers, bon nombre d’applicatifs d’automatisation de processus ont été modélisés, implémentés et maintenus grâce aux compétences internes du service.
Le compromis actuel
Fin 2013, 18 350 productions vidéos ou filmiques (pellicules 8 à 35 mm) et 6050 productions sonores sont inventoriées au sein des Archives de la Ville de Lausanne. Le stockage hors ligne des masters numériques représente 79 To pour la vidéo et 5 To pour le son (Ultrium LTO 6). Les Archives de la Ville de Lausanne ont pu affermir la pérennité de leur action en matière audiovisuelle sur deux piliers. Le premier pilier était une activité de production de films documentaires (16 mm puis vidéo numérique) portée par une commission créée en 1982 mais dissoute en 2011, faute de renouvellement des moyens. Une pratique de tournage et montage vidéo subsiste mais de manière très limitée. C’est une perte, car la pratique de la production avait l’avantage de faire dialoguer les exigences archivistiques avec les pratiques de tournage, dont chacun tirait des savoirs utiles et immédiatement exploitables. Même du point de vue budgétaire, la perte est évidente, car cette porosité entre production et archivage autorisait des investissements qui alimentaient toute la chaîne d’activité autour des sources audiovisuelles.
Le second pilier est une activité d’archivage des productions radios et télévisées d’intérêt local ou régional qui structurent l’espace médiatique lausannois depuis les années 1990: Radio Acidule, Télévision régionale lausannoise (Tvrl), La Télé (télévision Vaud-Fribourg) et Télé Bourdo.Net (télévision de quartier sur le câble). Il convient de relever que tous ces canaux de production ont bénéficié d’un soutien de la Ville de Lausanne, par subvention ou capitalisation.
Au fil des années, les versements journaliers se sont régulièrement accrus, alors que d’autres institutions liées à la Ville complètent les fonds audiovisuels des Archives de la Ville de Lausanne: théâtres, musées ou conseil communal notamment. Pour la seule télévision Vaud-Fribourg, depuis ses débuts en juillet 2009 et jusqu’en mars 2014, 7076 émissions représentant 2036 heures stockées sur environ 22 To, ont été versées. Pour l’année 2013, on dénombre 1132 émissions, soit 460 heures d’émissions stockées sur 5,4 To.
Pour toutes ces productions récentes, le format d’archivage est de type HDV 1080i (fichiers m2t, 16/9, 1440*1080) et le traitement se fait uniquement par transit de fichiers entre la régie et les serveurs de la Ville. A une autre échelle, TV Bourdo.Net, projet social de quartier né en 2002, offre ses réalisations aux archivistes grâce à un partenariat pensé dès les débuts. 1400 émissions représentant 440 heures ont été remises aux Archives. Symbole d’une hétérogénéité familière des archivistes audiovisuels, qui est aussi source de difficultés de gestion, en 2013, cette télévision de quartier a remis environ 500 Go de fichiers de type mov et mp4, certains en format SD et d’autres en HD.
Face à de tels accroissements et compte tenu des forces disponibles, il a fallu privilégier une démarche pragmatique en matière d’inventaire et d’accès aux sources. Tout d’abord, le temps machine pris par le codage rend impossible la convergence des formats versés vers un seul standard numérique. De plus, pendant plusieurs années, l’archivage impliquait la création de masters numériques sur cassettes (Digital S–4:2:2). La gestion documentaire souffrait alors de l’impossibilité à relier finement le niveau de description retenu – fondé sur le concept d’unité de «production» (film, émission télé, prise de son) – avec le stockage de plusieurs productions sur une cassette pour d’évidentes questions de coûts. En somme, l’inventaire ne pouvait être associé à un time code permet tant de lier master de conservation et fichier de consultation à l’inventaire. La lecture de l’inventaire permettait d’identifier les sources qu’il fallait ensuite «charger» sur magnétoscope ou mettre à disposition sur serveur manuellement.
Aujourd’hui, l’indexation vidéo a franchi une étape importante en permettant de traiter de manière intégrée et cohérente, la phase de numérisation (création et copie de conservation de masters, création conjointe de fichiers de consultation) avec celle de l’indexation et de la diffusion par un accès web.
Dans ce cadre, un des enjeux majeurs de l’archivage audiovisuel d’un corpus documentaire aussi ouvert que celui d’un centre d’archives publiques est d’avoir un modèle d’indexation riche, respectueux a minima de normes descriptives de base type Dublin Core, adapté aux forces de travail et disposant d’un outil logiciel qui permette de tirer profit, sans aucun délai de mise en ligne, du modèle archivistique mis en place pour faciliter les recherches documentaires des internautes, archivistes compris. Un outil qui doit donc être à la fois un instrument de gestion d’information et de communication efficace, en streaming, autorisant une régulation fine des droits d’accès comme des conditions de téléchargement. Un outil qui doit permettre enfin de conserver la totale maîtrise opérationnelle de la conservation des masters et des métadonnées introduites dans l’outil par extraction xml régulière déposée sur le serveur des Archives.
Certains projets (on peut citer par exemple le travail mené sur la collection Plans fixes) ont proposé une finesse d’indexation-segmentation des productions audiovisuelles qui dépasse les possibilités d’un travail «au long cours» alimenté journellement par de nouveaux versements. La grille d’analyse mise en place à Lausanne fait donc figure de compromis.
L’information est indexée sur deux niveaux: le premier, obligatoire, concerne la production (par production, on en tend émission télévisuelle, prise de son, captation de spectacle) dans son ensemble. Le second niveau, facultatif, consiste à documenter des segments temporels de la production. La segmentation a l’intérêt de pouvoir être menée à des niveaux de détail très variables, revue ou enrichie à tout moment et potentiellement confiée à toute personne accréditée, la possibilité de laisser des commentaires ou des annotations étant généralement une option logicielle très attractive mais indépendante de la pure indexation.
Niveau d’indexation «Vidéo»
Fonds:
– identificateur non ambigu du fonds d’archives dont provient la vidéo
Cote:
– identificateur non ambigu de la vidéo
Titre:
– titre original ou factice avec mention du fonds et de la date de production/ diffusion
Description:
– résumé de la production sous forme de texte libre
Langue:
– langue principale, multilingue ou muet
Date:
– de la première diffusion ou de la production
Durée:
– mention facultative pour les documents sous droits ou non communicables et conservés hors ligne
Format master:
– format du document reçu par les Archives analogique ou numérique
Format transfert:
– format du master vidéo conservé par les Archives sur bande Ultrium. Plus de 30 formats dénombrés.
Genre:
– type de la production selon liste fermée de 14 entrées:
– Actualité
– Communication et publicité
– Conférence
– Débat
– Divertissement
– Evénement muséal
– Evénement politique
– Evénement sportif
– Fiction
– Images non montées
– Pédagogie
– Portrait et interview
– Reportage
– Spectacle
Période:
– découpage par blocs temporels pour faciliter la navigation dans les archives audiovisuelles
Droits:
– mention du détenteur
Emission:
– mention facultative du nom de l’émission dont est issue la vidéo
Animateur:
– patronyme du présentateur de la production, le cas échéant
Niveau d’indexation «Séquences»
Localisation:
– découpage géographique repéré à l’indexation de la séquence soit: mention des continents pour production hors Europe, des pays européens hors Suisse, des communes suisses hors Lausanne, des rues ou quartiers de Lausanne.
Domaine:
– liste fermée de huit domaines thématiques: art et culture, économie, formation, politique, science et technique, société, sport, territoire.
Intervenant:
– nom, prénom ou pseudonyme de toute personne identifiée
Organisation:
– nom de l’organisation, entreprise, association ou collectif concernée
La plus-value de la segmentation en richie par une indexation fondée sur des descripteurs contrôlés est incontestable si on la compare à un simple résumé des contenus comme on le rencontre le plus souvent sur des plate formes de type YouTube.
Elle facilite la recherche d’images pour une exploitation d’extraits ou d’objets documentaires faisant «chapitre» dans un ensemble plus large, notamment dans la production télévisuelle d’information. Elle n’entrave en rien la consultation irremplaçable d’un objet dans son intégralité et ne nécessite pas de segmentation physique des fichiers. Elle participe d’un système général d’information qui peut – à l’image de toutes les normes archivistiques – être d’une granularité variable entre le fonds et la pièce. L’atome limite de référence serait ici le «frame» rapporté à un time code.
Demain, l’indexation
Aujourd’hui, on entend quotidiennement: «Produisez, partagez, le cloud se chargera du reste!» Le traitement archivistique valorisé ici serait-il une étape intellectuelle que les mirages du numérique tendent à mettre «hors jeu»? Pour les archivistes pourvoyeurs et contrô leurs des métadonnées, quelles voies fautil préconiser aujourd’hui, dans un contexte temps-ressources très limité en regard des heures de production à archiver?
Pour apporter une réponse crédible, il faut se tourner vers l’industrie dont les développements sont dictés par un modèle de consommateur toujours plus exigeant, désireux d’accéder instantanément à un contenu, payant ou non. En somme, l’industrie audiovisuelle va passer d’une culture de masse à une culture singularisée massive faisant de l’enrichissement contextuel et sa commercialisation, la clé d’un business juteux.
D’ores et déjà, l’automatisation de l’indexation associée au speech to text (reconnaissance vocale automatique) permet une transcription à la mesure des volumes conservés, point de départ vers d’autres usages de l’indexation. Les tests menés sur le logiciel Vocapia à partir de sources lausannoises montrent un réel potentiel pour constituer des descripteurs contrôlés, en parallèle d’une recherche libre sur le texte ainsi généré. La création d’ontologies locales en sortira renforcée et plus aisée à maintenir. Au prix sans doute d’un traitement préalable des particularités régionales liées aux accents des intervenants et à l’interprétation des noms propres, l’indexation des archives audiovisuelles lausannoises va se tourner rapidement vers ce modèle, à l’image de ce qui se fait aujourd’hui pour la presse écrite.
De plus, les analyses de formes ou la reconnaissance faciale permettront de faciliter des recherches sur les compo sants visuels de l’image. Ces analyses modélisées sous mpeg7 permettront le déploiement longtemps retardé de cette norme, aujourd’hui difficilement exploitable du fait d’un coût de traitement manuel trop élevé.
L’archiviste déclassé par la machine?
Si l’indexation peut se déployer à travers des algorithmes toujours plus puissants et être utilisée à travers des interfaces utilisateurs également toujours plus smarts pour guider l’internaute, faut-il imaginer que l’archiviste audiovisuel est voué à disparaître?
L’ère numérique, associée à l’évidence trompeuse de l’image, est source de représentations simplificatrices des archives et surtout de ce qui devrait fonder le travail d’archivage: la préservation d’une connaissance approfondie du contexte de production et de transmission, seul moyen d’éviter une lecture naïve ou illustrative voire instrumentalisée, des documents tirés d’un passé pas si lointain. C’est d’ailleurs cette dimension éminemment historique de l’information à gérer, volontiers écartée au nom de préoccupations à court terme, qui offre encore un sens et une spécificité au métier d’archiviste. Je reste persuadé que l’archiviste audiovisuel ne se résumera pas à un veilleur technicien mais que la connaissance comme la valorisation des fonds dans leur connexion à la production audiovisuelle archivée, en collaboration avec les universitaires ou d’autres métiers, est une exigence. Si la machine doit remplacer une part du travail mené par l’archiviste, celuici doit en profiter pour cultiver cette dimension de l’esprit qu’est l’espace de l’analyse et du discours interprétatif, toujours débattu, toujours reconstruit et qui rencontrera encore longtemps une demande sociale, virtuelle ou non. Sur cela, les humains ne devraient rien devoir céder à la machine.
Résumé
Die Verschlagwortung der audiovisuellen Archive der Stadt Lausanne ist heute direkt mit einem E-Suchportal im Internet verbunden (www.dartfish.tv/lausanne). Die Verschlagwortung von Ton- oder Filmdokumenten, die die Dublin-Core-Norm erweitert, erfolgt auf zwei Ebenen: Die erste, obligatorische Ebene ermöglicht es, das Produkt allgemein zu beschreiben. Die zweite Ebene nimmt eine Verschlagwortung der Produkte mittels Segmentierung vor. Dadurch können die Sichtweisen auf das audiovisuelle Objekt vervielfacht werden, und die verschiedenen Sichtweisen können mit einem eindeutigen Timecode verknüpft werden, der sowohl für die Suchportaldatei wie auch für das Original gilt. In den kommenden Jahren wird aber die Verschlagwortung stark automatisiert werden. Die erste Etappe (die automatische Transkription von gesprochener Sprache) bietet die Grundlage für verfeinerte semantische Verfahren und könnte gekoppelt werden mit Verfahren zur Formerkennung, was neue Modelle für die Suche in den vorhandenen Beständen ermöglichen würde.