Atlantico, c'est qui? c'est quoi ?
Lundi 20 Août 2018 | Créer un compte | Connexion
Extra

L'explosion des données sur Internet révolutionne notre mémoire collective

Depuis l'apparition d'Internet, le volume de données à stocker n'a cessé d'augmenter à tel point qu'on pourrait bientôt avoir épuisé tous les mots pour le qualifier. De méga à giga, en passant par tera et peta, les préfixes utilisés pour décrire les accumulations de "bits" viennent à manquer tandis que se pose la question des moyens à employer pour stocker les archives du web.

Big data

Publié le - Mis à jour le 24 Décembre 2012

Atlantico : Internet est-il en train de révolutionner notre rapport à la mémoire collective?

Clément Oury : Auparavant, les institutions de mémoire ne récupéraient que les choses qui étaient filtrées : il y a toujours eu un filtre éditorial, car cela coûtait cher de produire du contenu.

Au temps de l'imprimerie de Gutenberg, produire coûtait évidemment plus cher que de sortir des journaux à feuilleton au 19e siècle. La production de contenus, sur papier ou DVD, a toujours été un enjeu industriel ou commercial.

En termes de production, ce filtre éditorial a aujourd'hui disparu dans la plupart des cas. On est passé d'une logique où quelques-uns parlaient à tout le monde, à une logique où tout le monde parle à tout le monde. Le dépôt légal, l'obligation pour tout éditeur ou tout producteur de contenu d'envoyer un ou plusieurs exemplaires de sa production auprès d'institutions, qui existe depuis le 16e siècle, permet de conserver une image représentative de ce qu'était la consommation et la production culturelles à un moment donné. L'idée était que de cette façon la BNF allait pouvoir disposer d'une collection exhaustive de tout ce qui a paru sous forme de livre, de 75 tours, de CD, de DVD, de jeux vidéos, … qui ont paru ou qui ont été diffusés en France.

Grâce au dépôt légal d'Internet, on a accès à des sources populaires auxquelles on n'avait pas accès auparavant. On peut constituer ce qu'on appelle des archives, qui sont plutôt des collections de sites, qui donnent des points de vue très différents de ce qu'on avait auparavant, et qui n'est pas filtré.

A titre d'exemple, lors des émeutes dans les banlieues en 2005, nous avons collecté très largement sur les sites de la plateforme Skyblog. Les personnes qui écrivaient sur cette plateforme étaient souvent des gens dans les banlieues. Ils n'étaient pas forcément du côté des émeutiers, mais ils étaient situés vraiment dans les villes alors que les journalistes étaient plutôt derrière les grillages de policiers. Le discours qu'on a sur ces blogs de collégiens est en contrepoint tout à fait passionnant, par rapport au discours plus "extérieur" que les journalistes ont eu. Cela ne signifie pas que le discours sur ces blogs est plus "vrai", mais croiser différentes sources sera bon pour la recherche scientifique. On a maintenant accès à des paroles qui n'étaient pas publiques, pour les sociologues et historiens futurs, c'est une source qui est complètement nouvelle.

Cependant, les contenus d'Internet sont apparemment omniprésents. Mais le problème est le suivant : lorsqu'on a un contenu qui est en ligne, il est apparemment accessible à tous. Mais si cette copie disparaît, on perd tout, au contraire des livres qui sont tirés à 1000 exemplaires. Une seule perte entraîne la perte de l'accès pour tout le monde. La logique est très différente.

En 2012, Internet est devenu le principal support de création scientifique et culturel, et il fallait trouver comment stocker tout ce contenu.

 
Commentaires

Nos articles sont ouverts aux commentaires sur une période de 7 jours.
Face à certains abus et dérives, nous vous rappelons que cet espace a vocation à partager vos avis sur nos contenus et à débattre mais en aucun cas à proférer des propos calomnieux, violents ou injurieux. Nous vous rappelons également que nous modérons ces commentaires et que nous pouvons être amenés à bloquer les comptes qui contreviendraient de façon récurrente à nos conditions d'utilisation.

  • Par kettle - 23/12/2012 - 09:37 - Signaler un abus meta tag

    "car lorsque l'on collecte les sites, on le fait sans demander aux éditeurs l'autorisation de les archiver. [...] On ne peut pas s'amuser à demander des autorisations à chaque site web" --- Et respecter les tag? On peut pas non plus a la BNF?

  • Par kettle - 23/12/2012 - 09:39 - Signaler un abus meta name="BNF"

    meta name="BNF" content="noarchive"

Pour commenter :

Depuis son lancement Atlantico avait fait le choix de laisser ouvert à tous la possibilité de commenter ses articles avec un système de modération a posteriori. Sous couvert d'anonymat, une minorité d'internautes a trop souvent détourné l’esprit constructif et respectueux de cet espace d’échanges. Suite aux nombreuses remarques de nos lecteurs, nous avons décidé de réserver les commentaires à notre communauté d’abonnés.

Clément Oury

Clément Oury est chef du service du dépôt légal numérique, au sein du département du dépôt légal à la Bibliothèque nationale de France.

Voir la bio en entier

Je m'abonne
à partir de 4,90€