Donner ses données, reprendre c'est voler ?

Les défis du Big Data : sociaux, éthiques, techniques

Partager :
21 février 2022
90% des données mondiales ont été créées depuis 2019. À l'ère d'une accumulation irraisonnée de nos données personnelles, de nombreuses questions voient le jour. Au cœur d'entre elles : quel avenir pour nos données ? Nous avons rencontré Tyler Reigeluth, maître de conférences en philosophie et spécialiste des enjeux éthiques et sociaux du numérique. Réflexion, en préambule du colloque « À l'épreuve des données » organisé dans le cadre de la Biennale ECOPOSS (26-30octobre 2022).  
Image
data

Aujourd’hui, ce sont près de 1,7 Mo de données créées chaque seconde par personne. Ce chiffre prend tout son sens, lorsqu'on sait qu'il va être multiplié par 45 entre 2020 et 2035, selon le journal du net. Les chiffres sur la massification des données donnent le vertige. « On est désormais dans cette logique : les données sont là, on verra bien ce que l’on en fera », décrypte Tyler. C’est ce qu’il appelle la question de la « disponibilité des données ».  

La plupart des entreprises et institutions partent du principe que l’on n’a jamais assez de données. Tant que l’on peut en produire, on en produira. La donnée est surnommée le « charbon ou le pétrole moderne de l’industrie ». C’est d’autant plus le cas à l’ère de l’intelligence artificielle et des algorithmes apprenants. La quantité de données est telle qu’on suppose que les algorithmes trouveront bien quelque chose qui pourra servir. Une logique très différente serait de se poser la question de leur finalité, avant même de les récolter.  

On commence à s’apercevoir que l’accumulation des données est aussi un enjeu matériel : data center, électricité, énergie. Ce sont ces infrastructures et cette matière qui rendent possible la donnée. Ce cumul a donc une fin en soi, celle de la limite physique de ces installations.  

Les data centers consomment une énorme quantité d’énergie avec un impact croissant sur l’environnement. Pour compenser, de nombreuses "innovations" voient le jour. On construit des hébergeurs de données en zone arctique pour réduire le coût d’un des plus gros postes en énergie de ces structures : le refroidissement. Des travaux de recherches visent aussi à récupérer la chaleur pour en produire de l’énergie. Mais pour Tyler, ce « solutionnisme technologique » n’est pas adapté. Pour lui, « si le problème n’est pas d’ordre technologique, pourquoi trouver une solution de cet ordre ». Il pointe du doigt notre rapport aux données, comme levier d'action possible.  

infographie data

 

 

Qu’adviendra-t-il si une catastrophe équivalente à l’incendie de la bibliothèque d’Alexandrie arrivait aujourd’hui ? Qu’arrivera-t-il si les centres de stockage de Google ou d’Amazon tombaient en panne ? 

 

La mémoire humaine stockée sur des serveurs : pour quelle sécurité ?  

Le stockage physique de la donnée, implique de s'interroger sur sa durée de vie. Tyler alerte sur la perte potentielle de notre mémoire désormais extériorisée à une échelle inédite. 

« On vit dans une société où, de manière plus ou moins consciente on a l’impression que tout est retenu, accumulé, stocké, que l’on n’oubliera rien ». Cette façon de penser représente, selon Tyler, un danger pour la mémoire humaine. Depuis l’avènement de l’écriture jusqu’à internet, on a développé une mémoire externe. Il s’interroge : « Qu’adviendra-t-il si une catastrophe équivalente à l’incendie de la bibliothèque d’Alexandrie arrivait aujourd’hui ? Qu’arrivera-t-il si les centres de stockage de Google ou d’Amazon tombaient en panne ? » 

Les récentes pannes comme celle de Facebook en octobre dernier, laissent la plupart des utilisateurs désemparés et inquiets quant à l’avenir de leurs données. Les infrastructures du réseau ne sont pas sans limite, et cela soulève la question de la concentration du réseau aux mains de quelques acteurs et l’enjeu technique autour des centres de données.  

Tyler Reigeluth nous invite à réfléchir à un stockage plus raisonné de nos données. Aujourd’hui, le réflexe de chacun est de tout garder, mais « ne faudrait-il pas commencer à développer une sorte de sélectivité de ce que l’on garde, ce que l’on efface » ? Il évoque Nietzche : « La mémoire c’est aussi un processus d’oubli et de souvenir. Pour se souvenir, il faut oublier ».   

 

Une branche cassée dans une forêt ne veut pas dire la même chose pour un chasseur ou un traqueur que pour un baladeur du dimanche.

La donnée : une représentation plus ou moins accessible ?  

« La donnée n’est pas donnée », cette célèbre formule du sociologue Alain Desrosières souligne la difficulté à appréhender cet outil. Les données sont devenues immatérielles, ce ne sont plus des piles de dossiers remplis de chiffres. La production en masse ajoute un autre degré de difficulté du fait que les données deviendraient quasi insensibles. Tyler constate qu’ « on ne les perçoit pas ». Mais au final, qu’est-ce qu’une donnée ?  

Tyler s’interroge : « Est-ce que c’est une trace sur un circuit intégré ? Est-ce que c’est quelque chose qui se représente, qui se dit dans le langage naturel ou langage artificiel ? ». Les « données sont construites » reprend Tyler, « elles sont le produit de l’activité humaine, […], et forment un langage artificiel informatique ». Cette définition peut « évoluer dans le temps, selon les besoins, les questions sociales ou encore les types de techniques ».  

Pour lui, une personne lambda fait l’expérience de la donnée au quotidien de différentes façons. Chaque site web a aujourd’hui l’obligation d’annoncer la récolte des données via le système des cookies et de proposer aux internautes d’y consentir. Pari réussi pour la législation européenne. Un acte de consentement qui « reste insuffisant », pour Tyler, mais qui a le mérite de « mettre en lumière l’omniprésence de la donnée ». D’un autre côté, si l’on tape dans Google « donnée numérique », on trouve une multitude d’images plus ou moins génériques ou fantasques pour se représenter cette réalité. Il n’existe pas d’objet susceptible de la représenter. Mais alors, comment rendre la data plus accessible, plus tangible ?  

Une solution pour ce chercheur en philosophie serait de réussir à la visualiser sous une autre forme. Il suggère : « la donnée est une forme de trace », et ajoute, « une donnée est toujours ce qui est laissé par le passage de quelqu’un ou quelque chose, ce qui fait trace ». Il illustre ses propos : « Une branche cassée dans une forêt ne veut pas dire la même chose pour un chasseur ou un traqueur que pour un baladeur du dimanche ». Dans cet exemple, la branche est la donnée. Là où le randonneur ne s’apercevra peut-être même pas de la présence de la trace, le traqueur va être capable de l’interpréter pour connaître la direction prise par l’animal. Aujourd’hui, nous laissons sans cesse des traces de nos activités, souvent à notre insu. Un phénomène qui interroge : « Qui peut les interpréter et, est-ce que les personnes qui laissent des traces ont aussi le droit de les interpréter ? ». 

  

Droit de propriété de la donnée : public ou privé ?  

Avec la massification des données, se pose la question de leur propriété. À qui appartiennent-elles ?  

Aujourd'hui, nous sommes face à un déséquilibre. Les sociétés privées Amazon, Google, Microsoft ont la capacité de stockage et la puissance de calcul la plus importante. Les chercheurs académiques n'ont d'autre choix d'y travailler. En ce sens, on peut dire que la data appartient à ces multinationales. Elles sont le Big Data.  

Si l'on prend l'exemple des villes intelligentes (ou smart cities), l'enjeu de la propriété des données est d'autant plus grand. Selon Tyler, l’inquiétude serait qu’une seule entreprise comme « Google ou Cisco (ndlr : entreprise informatique américaine spécialisée dans les serveurs), prenne en charge le pilotage des structures générant les données ». Elle aurait de fait la main mise sur l’ensemble des habitudes de vie et de consommation des habitants de ces villes. 

Des alternatives à la gouvernance des données sont à l’étude. Une piste intéressante pour le futur serait de « truster les données ». Trust signifie à l’origine, une structure juridique collective. Pour Tyler, l’idée serait que cette structure permette « aux habitants ou représentants de la ville d’avoir un usage et une certaine propriété sur ces données ». Et ainsi, faire passer la gestion des données de l’ordre du domaine privé au domaine public.  

Bérénice ROLLAND

 

Pour aller plus loin :

Comment consommer le numérique autrement ? - ECOPOSS

Nos données peuvent-elles servir l'intérêt général ? - Les Echos
Le Data Trust : nouvel outil de mise en capacité du citoyen ? - Blog Seriously
Anatomy of an IA system Kate Crawford and Vladan Joler
Entretien entre l'association Pénombre et Alain Desrosières - PDF à télécharger
L'intelligence des traces - Intellectica
Why data is not enough: Digital traces as control of self and safe-control - Tyler Reigeluth, Queen's University Library

 

 

Partager :