Umberto Eco décrit dans son roman Le nom de la rose l’organisation, la conservation des données et l’accès au savoir, il y a sept siècles dans la bibliothèque d’une abbaye, qui finira par brûler, détruisant ainsi le travail des moines copistes, premiers artisans de la redondance avant l’invention de l’imprimerie puis de l’informatique.
Ce type d’événement s’est reproduit au travers des époques avec à chaque fois des pertes de connaissances. L’épisode le plus récent dans notre époque de dématérialisation, est l’incendie spectaculaire à Strasbourg le 10 mars 2021 d’un « data center » – c’est-à-dire d’un centre de stockage et de traitement de données – qui a eu des conséquences importantes pour les utilisateurs. Cet incident est révélateur de la fragilité des infrastructures numériques (ordinateurs, serveurs, racks de stockage, réseaux de communications, alimentations électriques, climatisation…), qui amène à des pertes de données parfois irréversibles, et des services interrompus (systèmes d’information, applications informatiques, messageries, sites Web…).
Un tel accident industriel nous interpelle en fait sur la réalité physique du monde numérique. Celui-ci s’est construit depuis une quarantaine d’années autour de machines informatiques concentrées dans des réseaux de data centers qui constituent le nuage numérique ou « cloud ». Ce « nuage », d’apparence immatérielle, repose en fait sur des infrastructures distribuées et interconnectées à l’échelle de la planète. On recense à ce jour près de 5 000 data centers dédiés ou mutualisés répartis dans 127 pays dans le monde, certains pouvant héberger des dizaines de milliers de serveurs.
L’histoire de l’informatique est faite d’alternances du local au global entre des infrastructures centralisées et distribuées : centralisées au siècle dernier autour d’un ordinateur unique, puis distribuées avec l’avènement de l’informatique nomade (PC, tablettes, smartphones, objets connectés…), puis mixte de nos jours avec des services de plus en plus externalisés vers des sociétés spécialisées (GAFAM par exemple) pour sauvegarder et traiter des données, ou communiquer au travers des réseaux sociaux, ou dans le télétravail par visioconférences et documents partagés.
Comment stocke-t-on des données de manière sécurisée aujourd’hui ?
Si on regarde l’usage individuel, il y a 30 ans les données étaient stockées sur des disquettes de capacité de 1 méga-octet (106 octets) puis des CD, des clés USB… Aujourd’hui un disque dur magnétique personnel de 1 téra-octet (1012 octets, soit mille milliards) – qui a la taille d’un smartphone – représente l’équivalent d’un million de disquettes pour un coût de quelques dizaines d’euros. La sauvegarde des données de manière pérenne est une évidence depuis les débuts de l’informatique, avec au départ des matériels et des logiciels peu fiables.
Aujourd’hui, l’heure est à l’explosion des données liées à nos usages, par exemple la sauvegarde instantanée dans le cloud de photos et vidéos saisies sur un smartphone. L’heure est aussi à toutes les formes actuelles connues de piratage, et de cybercriminalité. Sauvegarder ses données nécessite des précautions, par exemple dans des lieux de stockage sûrs.
Au niveau professionnel, beaucoup d’usagers et de sociétés n’ont pas les moyens de disposer d’une infrastructure informatique autonome et robuste, compte tenu des coûts d’acquisition, de maintenance, de sécurisation, de mise à jour, et des ressources humaines associées. Ils font donc appel à des sociétés spécialisées qui vendent leur maîtrise de la sécurisation des données, que ce soit en termes de confidentialité, de protection de savoir-faire ou de vie privée. Notons aussi que les enjeux de souveraineté des États dans l’accès aux données sont cruciaux. La distribution des données et de leurs traitements à l’échelle de la planète – et un jour de l’espace avec des grappes de satellites établissant les communications entre serveurs – offre de nombreux avantages sous réserve d’une bonne compréhension des limites physiques des infrastructures utilisées, notamment en cas d’accident.
Un regard critique sur les offres actuelles est donc indispensable : où sont stockées mes données ? Comment sont-elles protégées, sécurisées et sauvegardées ? Quelle empreinte carbone pour mes usages numériques ?
Quels coûts pour cette virtualisation de nos systèmes informatiques ?
Certains opérateurs offrent des services clés en main répondant à ces exigences. D’autres offrent à des coûts moindres des possibilités d’accès à des machines, en laissant aux clients la responsabilité de leurs choix, par exemple dans la gestion des sauvegardes – les contrats entre les parties régissent les détails de ces usages. La notion de qualité de service est donc essentielle.
Une bonne communication sur les technologies utilisées et leurs limites parfois insaisissables pour les usagers est indispensable : quels sont les niveaux de protection de mes données dans le contrat souscrit ? À quelle fréquence se font les sauvegardes, et comment ? La CNIL rappelle en particulier les obligations en matière de notification, en cas d’indisponibilité ou dans le pire cas de destruction de données personnelles déposées dans un data center.
La réalité physique du monde numérique pose aussi la question des ressources énergétiques nécessaires à ces infrastructures et à nos usages les plus voraces en énergie (vidéos en streaming, gestion de la monnaie virtuelle, les bitcoins). L’empreinte environnementale de nos périphériques numériques connectés et des infrastructures de communications, calcul et stockage ne peut être ignorée : la part globale du « numérique » dans les émissions de gaz à effet de serre augmente chaque année et dépassera bientôt les 5 %, avec une consommation en énergie de 2000 térawatts-heures soit 10 % de la demande mondiale d’électricité.
Des solutions techniques>
Des solutions scientifiques et technologiques émergent pour fiabiliser et accompagner les transitions numériques et énergétiques qui sont indissociables.
Cela pourrait par exemple conduire à des « circuits courts numériques » de fiabilisation et de sauvegarde, associés à chaque data center et valorisant des générations de machines informatiques plus anciennes fonctionnant exclusivement avec des énergies vertes. Ces machines pourraient être distribuées à l’échelle d’une région, ce qui limiterait l’impact d’un accident industriel sur un site donné, en jouant sur la redondance des machines pour assurer des sauvegardes.
En effet, un service basé sur une redondance de ressources informatiques est en cas d’accident toujours bien meilleur qu’une perte irréversible de données numériques, que ce soit pour des usages privés ou professionnels. Pour beaucoup d’applications ne nécessitant pas de calculs hautes performances, ou pour la gestion locale des données et des services offerts aux usagers à l’échelle d’un territoire ou d’une ville intelligente, il est envisageable de coupler en « circuit court numérique » la production et le stockage des données avec les énergies vertes, que ce soit en termes de récupération de chaleur ou de production d’électricité d’origine renouvelable.
Michel Robert, Professeur des Universités, Université de Montpellier
< !—> http://theconversation.com/republishing-guidelines —>