Internet oublie tout

Il y a quelques mois j’ai pensé écrire un article sur une question Internet n’oublie rien ou Internet oublie tout ?

Je ne l’ai finalement pas fait par manque de temps. Je pense que c’est une bonne chose avec le recul car désormais je n’ai plus besoin de me poser la question ou de raisonner car je connais la réponse, Internet oublie tout.

Il y a plusieurs raisons à cela. On se rend compte d’un rapprochement des individus grâce à Internet et aux moyens de communication modernes. Une personne lors d’un événement, vivant sur place, connaissant le contexte, parlant la langue peut prendre une photo avec son smartphone d’un événement important et la publier ensuite sur Twitter alors qu’un journaliste aguerri ne pourra ni être aussi près ni être à un meilleur endroit pour faire cette photo. On a un rapprochement de l’information et une instantanéité de celle-ci, à tout moment et partout un événement peut se produire et on peut être averti ou notifié de cela.

Mais du coup on a une explosion de la masse d’information qu’on résume en général par cette phrase qui veut tout dire : Trop d’information tue l’information. L’infobésité, l’information perd de sa valeur, perd de sa visibilité lorsqu’elle est entourée de 10, 100, 1000 autres informations. C’est simple l’information importante à retenir n’est plus visible, n’est plus facile à retrouver, s’oublie plus facilement remplacée par de nouvelles informations.

La seconde raison, qu’est-ce qui fait qu’Internet n’oublie rien ? Bah justement pas grand-chose. Quelles solutions existent pour retrouver une information effacée ? Vous aurez le cache de Google et vous aurez la Wayback Machine. Je ne dis pas qu’il n’y a pas d’autres outils mais ce sont les plus efficaces et quasiment les seuls pour avoir un résultat intéressant. On parle souvent du cache Google comme LA solution, je rappelle que vous ne trouverez pas le cache Google d’une page datant d’il y a 1 an ni même datant de 3 mois, ça restreint tout de même un peu « Internet n’oublie rien ». Google n’archive pas les contenus, il les crawle, c’est-à-dire qu’il collecte les ressources (pages Web, images, vidéos, documents Word, PDF, etc.) afin de permettre à un moteur de recherche de les indexer (voir la définition de robot d’indexation). Il faut aussi rappeler que le fichier robots.txt permet de restreindre la collecte des ressources sur les sites internet par les robots d’indexation donc ce n’est ni automatique ni magique. Concernant Internet Archive (qui fournit la Wayback Machine), il s’agit d’un organisme à but non lucratif par conséquent le jour où il n’y aura plus de dons, il n’y aura plus d’Internet Archive.

La troisième raison c’est que pour « enregistrer », « conserver », « sauvegarder » la totalité des informations sur Internet il faudrait des ressources énormes en terme de compétence (homme), d’argent, d’espace pour stocker serveurs et disques durs. Aucun état et aucune entreprise n’est en mesure de le faire. D’où je peux tirer une telle certitude ? Et bien quel intérêt car il en faut un tout de même ? Certains auront la NSA au bord des lèvres dans un intérêt de surveillance. Son fonctionnement est similaire aux moteurs de recherche, ils crawlent seulement. Certains diront que les informations sont conservées par les entreprises qui éditent les sites. Pensez-vous qu’un article paru aujourd’hui sera conservé encore 10 ans par une entreprise ? Pensez-vous que vous y aurez accès ?

La quatrième raison touche à ce qu’est une information, son « essence ». Elle a probablement une durée de vie limitée, il faut que cette information soit sûre ou vérifiée (par exemple avec des sources extérieures, une démonstration, une preuve comme une image, des arguments), il faut aussi tout simplement qu’on puisse la consulter ou la retrouver…

Et oui aussi évident et bête que cela soit, encore faut-il pouvoir retrouver cette information. Ce que font les robots d’indexation pour les moteurs de recherche nous devons également le faire pour tous nos documents électroniques : on les range par dossier, on leur donne des noms et parfois on les classe par tags. Pour résumer nous devons indexer, trier puis ranger l’information afin de pouvoir la consulter ou la retrouver en temps voulu. Ce processus n’a rien d’automatique et est totalement lié à notre façon de faire, finalement à nous. Si ce processus n’est pas effectué (et il doit l’être car aucun logiciel ne pourra jamais répondre à **notre** façon de ranger) alors l’information est perdue, introuvable, inutile. Voir autour de ce sujet les multiples classifications bibliographiques.

Une autre raison est que la donnée est le nouvel eldorado. A l’heure du Big Data, du Quantified self et des objets connectés, à l’heure où l’information vaut de l’or car elle est stratégique (politiquement et économiquement) mais à l’heure où elle est omniprésente, il faut traiter cette information. Il faut lui donner du sens, il faut pouvoir faire une recherche dessus, il faut pouvoir l’analyser. Nous sommes revenu au temps des chercheurs d’or, un gramme d’or pour 10 kilos de terre. Autant d’informations jetées et inutiles.

Je m’arrête là car ce n’est pas le but de cet article d’énumérer toutes les raisons au fait qu’Internet oublie tout, c’est d’ailleurs une bonne chose qu’Internet oublie tout. Si Internet n’oubliait rien ce serait un cauchemar Orwellien, chaque commentaire dans un article, chaque image sur les réseaux sociaux seraient conservés et nous suivraient toute notre existence. Ce serait la fin de la vie privée, plus de moyen de se cacher, il n’y aurait plus d’oubli, plus de pardon possible.

Pourquoi je vous dis tout cela ?

Pour que vous fassiez des sauvegardes (avec des outils comme ScrapBook, FireShot, Zotero). Oui, sérieusement. Je lisais l’article de Coreight et ce n’est pas la première fois que je me fais la réflexion, on ne parle pas de la sauvegarde des informations, comme si elles allaient être disponibles indéfiniment. Quid de la fermeture du site, du changement du nom de domaine, d’un nouveau CMS (système de gestion de contenu) rendant totalement inutile d’avoir l’adresse internet où se situe l’information ?

Avez-vous vu des services, sites, blogs fermer ? Nous allons vers une rationalisation d’Internet, vers une concentration de sites et finalement vers un contrôle d’Internet. Internet n’est plus une « zone de non-droit », il est limité par des intérêts économiques et politiques, il est indexé par des lois liberticides comme la loi Renseignement et des agences comme la NSA. Nous avons laissé ce fantastique outil dépérir et se vider de son potentiel de liberté, d’échange, de partage.

Sauvegardez les idées, réflexions, arguments, articles, critiques que vous croisez sur Internet car ils sont voués à disparaître.

N’oubliez pas cet article.

Déjà 3 avis pertinents dans Internet oublie tout

Yop
Bien que globalement d’accord sur l’idée qu’Internet oublie tout (contrairement à l’argument anxiogène bien commode qui prétend qu’internet n’oublie rien!), il n’en reste pas moins que je trouve qu’il y a des claques qui se perdent…

Pourquoi polluer une idée a peu près claire par le sempiternel couplet sur le déclin d’internet !!?? Ça fini par me donner la nausée.
En plus, ça se démonte en quelques secondes :
«Avez-vous vu des services, sites, blogs fermer ?»
Houla oui, mais tiens, comme c’est étrange, pourquoi chaque pluriel n’est associé qu’à un *seul* exemple…
Au fait, personne ne parle donc des sites, services, blogs qui ouvrent ? sont-ils donc à ce point moins nombreux ??

«se vider de son potentiel de liberté, d’échange, de partage.»
Foutaises et encore foutaises. Avec chaque semain qui passe, le nombre services, réseaux, logiciels que je peux utiliser augmente (qu’il soit libre ou pas, gratuit ou pas, privatifs ou pas …)
Jhttps://fr.wikipedia.org/wiki/Web_profond

    Hello,

    Je suis d’accord avec toi, je glisse facilement dans la déprime depuis la loi renseignement mais j’ai fait soft là lol, tu verrais ce qu’il y avait au départ !

    Tcho !

      Un partout, balle au centre. Moi aussi j’ai fait soft…

      C’est gonflant de lire toujours les mêmes pleurnicheries sur les libertés qui diminuent, venant de la part de blogueurs établis qui jonglent avec les blogs, les réseaux sociaux, les rss… qui s’expriment sur tout et n’importe quoi … « en toute liberté ».

La discussion est malheureusement close.