logo

"Un homme sérieux a peu d'idées. Un homme à idées n'est jamais sérieux" Paul Valéry


blog médias Tribunes Donation etc.

Du mauvais usage des données

jeudi 11 mars 2010

Dans son édition du 27 février dernier, l’hebdomadaire anglo-saxon The Economist y a consacré une étude spéciale : le stock de données annuellement produit est passé de 150 exabytes en 2005 à 1200 exabytes en 2010. Que ce soient les entreprises – veille concurrentielle, maintenance, etc. - les gouvernements – conjoncture, chômage notamment - ou les particuliers – achats, boîtes mails, réseaux sociaux et plus - nous sommes tous des surproducteurs de données. A tel point que l’on peut se demander s’il y aura assez de mémoire informatique pour stocker nos données d’ici à 2030.

Outre la question technique, l’accumulation des données pose évidemment des questions d’éthique : des millions de communautaires du réseau social Facebook ont divulgué pendant plusieurs jours sans le vouloir ni le savoir des photos, des informations privées et professionnelles suite à un changement de réglementation du site. Sans les partager avec d’autres usagers, Google, la Fnac.com ou voyages-sncf retiennent nos préférences et des informations commerciales relatives à nos recherches. La multitude de propositions qui nous sont faites, censées correspondre à nos préférences, n’a pas seulement un caractère liberticide – je suis sans cesse guidé dans mes choix – mais pose également une question de responsabilité.

Sommes-nous responsables de nos actes s’ils nous sont constamment suggérés ? Dans le fond, le débat n’est d’ailleurs pas récent. Robert Musil l’évoque en détail dans son œuvre « L’homme sans qualités » (1930, 1932). Fasciné par un condamné à mort, le personnage principal questionne le lien entre responsabilité et destin : autrement dit, peut-on tenir quelqu’un pour responsable d’un acte si l’acte en question était prédestiné par une courbe statistique ? Musil fait parler son personnage avec maestria : « l’essence du probable semble de plus en plus vouloir se substituer au problème de l’essence de la vérité ». Nous ne sommes plus que des probabilités ou des destins statistiques. Ceux qui s’en écartent ne sont que des « bruits blancs », des points statistiques erronés, qu’il faut gommer.

L’abondance de la donnée nuit par ailleurs à sa qualité. Plus il y a de données, plus les corrélations statistiques peuvent être fortes. Surtout, l’interprétation est de plus en plus difficile et l’usage peut-être grotesque, par exemple aux termes d’une réflexion sur les populations, mot qui renvoie d’ailleurs au contrôle statistique du peuple. Ainsi, on peut dire que l’homme français moyen fait 176 cm et pèse 77 kg, vit 77 ans et a deux enfants, gagne 1800 euros nets par mois et habite dans une commune urbaine de 14,88 km2 et de 22 000 habitants où il paye un loyer de 13 euros le m2. Il a un peu moins de 40 ans, fume 2,5 cigarettes par jour et boit 400 verres d'alcool par an. Le raisonnement sur les moyennes n’a pas forcément de sens. L’utilisation stupide des données est une tentation qui grandit avec leur disponibilité.

L’accroissement du stock de données nécessite donc une formation appropriée des citoyens à l’outil informatique et au traitement statistique, ce qui manque grandement aux formations universitaires françaises. A l’université de Chicago, un élève en philosophie reçoit une formation en probabilité et en méthodes quantitatives qui n’est pas dénuée de sens: J. Bentham et E. Kant s’opposaient bien sur des questions de théories des jeux ; la philosophie de J. Rawls tient son succès d’une formalisation des théories probabilistes du prix Nobel d’économie J. Harsanyi.

Comme le résume H.G. Wells dans « Mankind in the making » (1903): ‘Dans un temps peut-être pas très lointain, on comprendra que pour former le citoyen efficace, il est aussi nécessaire de calculer, de penser en termes de moyenne, de maxima et de minima qu’il est maintenant nécessaire de savoir lire et écrire’.

Partager

2 commentaires:

Anonyme a dit…

Sans que cela remette en cause votre argument, je me permets de douter des chiffres avancés pour le français moyen. Une cigarette et 0,00000141667 litre d'alcool par an semblent des valeurs extrêmement faibles, de même que 1,76 cm mais là je penche pour une coquille.
Pourriez-vous vérifier vos sources ?

Simon PORCHER a dit…

Merci beaucoup pour votre commentaire qui me permet de remettre à plat les chiffres. Vous faites bien de douter: les chiffres sont faux.

Un français fait en moyenne 176cm, fume 2.5 cigarettes par jour - soit 54 milliards de cigarettes vendues/(60 millions*365jours) - et boit non pas 0 litres mais plutôt 0,02 litres par jour - (10 litres de consommation par plus de 15 ans*48 millions de plus de 15 ans)/ (60 millions*365 jours), ce qui correspond à la dosette d'un verre d'alcool pur.

Les sources: INSEE.

Merci!

Enregistrer un commentaire