Une surveillance massivement maigre

Notez cet article

Les milieux informés me font savoir que nous sommes massivement surveillés par la NSA, le GCHQ, le fisc de Bercy, ma femme qui n’aime pas que j’aille sur Tukif, etc.

En clair, tout ce que l’on dit, fait, écrit sur Internet serait connu par ces mystérieuses organisations, tout cela dans le noble but de nous protéger, cela va de soit. Moi, j’aime beaucoup raconter des histoires, et j’aime aussi que l’on me raconte des histoires. Seulement, moi j’aime beaucoup aller loin, très loin dans ce que l’on me raconte et aussi prendre beaucoup de recul sur les choses.

Alors j’imagine que tout ceci est un un projet, un gros projet dont il faut prendre la mesure de ce que cela représente. Lorsque l’on s’atèle à la réalisation d’un tel projet, il est nécessaire de savoir de quoi l’on parle en matière de chiffres.

Dans mon cas, si je veux mettre en place une surveillance généralisée de tout l’Internet, je n’ai à priori que très peu d’informations qui m’aident à quantifier de quoi l’on parle. Néanmoins, j’ai à ma disposition des données sur un acteur bien connu du monde de l’Internet et qui a une démarche qui se rapproche de la mienne, j’ai nommé Google.

Bien évidemment Google ne travaille pas véritablement à vous espionner, quoique l’on dise mais son but est de tenter d’indexer la plupart des sites Web qui peuplent l’Internet. Même si nos deux buts diffèrent, on peut tout de même établir une corrélation entre nos deux entreprises, en matière de données d’infrastructure. Google va gérer un contenu et nous, nous allons gérer les connexions à ce contenu. Voici ce que l’on apprend:


Il y a donc 5 ans, Google disposait de 900000 serveurs. On peut vraisemblablement estimer que ce nombre a depuis lors beaucoup évolué. Mais nous allons rester une fourchette plutôt basse. Admettons donc qu’aujourd’hui Google a besoin de 1 million de serveurs pour indexer l’Internet. Nous avons là une donnée importante: c’est la puissance nécessaire pour faire fonctionner ses opérations.

Si je veux faire la même chose, à la même échelle, je dois donc partir sur un nombre assez similaire en matière d’équipement. Cela me donne une idée sur la masse de matériel qu’il me faudrait pour arriver à mes fins. Néanmoins, le chiffre de 1 million de machines est certainement sous-évaluée; outre mon choix pour une estimation assez basse, il faut rajouter beaucoup de choses pour faire fonctionner toutes ces machines.

Il faut tout d’abord relier ses équipements les uns avec les autres; ceci se fait au moyen d’un switch. Les modèles les plus courants sont les 24 ports et les 48 ports. Par souci d’économie, je partirai plutôt sur des modèles à 48 ports. J’ai donc besoin de 1 million divisé par 48, soit 20833 switches. Ensuite, il me faut des routeurs pour connecter mes différents réseaux, répartis sur toute la planète. Il est assez difficile d’estimer leur quantité, mais je vais considérer qu’il me faut un routeur pour 100 machines; prévoyons donc 10200 routeurs. A ceci, il faut ajouter divers équipements, comme quelques firewalls, répartiteurs de charge, équipements de stockage (SAN), etc. Au final, je peux prévoir jusqu’à 50000 machines supplémentaires pour faire fonctionner mon million de serveurs.

Une telle infrastructure risque néanmoins de ne pas passer inaperçu: il faut des datacenters pour héberger toutes les machines, un réseau considérable, plusieurs dizaines de milliers de personnes pour administrer toute cette infrastructure et surtout des centaines de millions d’euros de coût d’exploitation.

Je suis toutefois persuadé que les chiffres avancés ici sont en réalité sous-estimés: rappelez-vous que seule une partie de l’Internet est réellement visible et qu’il y a beaucoup de choses qui sont cachées aux yeux des bots de Google. Mais pour débuter, je pense que l’ordre de grandeur de plus de 1 million de machines est assez bon pour surveiller massivement l’Internet.

Le seul petit problème pour l’heure, c’est qu’il est absolument certain qu’une telle infrastructure n’existe pas, elle laisserait beaucoup trop de traces, que ce soit en empreinte matérielle, réseau, humaine et bien entendu financière. En réalité, seule une partie infime de l’Internet serait surveillée et même là encore, les informations obtenues sont à manier avec prudence. Donc, en conclusion, il est faux de dire que l’Internet est massivement surveillé.

 

3 commentaires sur “Une surveillance massivement maigre

  1. Ça ne serait pas théoriquement plus simple et moins cher pour les services mentionnés d’obtenir/imposer un accès chez google pour y faire tourner leurs bots ? Pure théorie, hein !

  2. @netref: dans ce cas, cela revient à installer des boites noires directement chez Google. Voir mon article sur les méchantes boites noires à ce sujet. C’est hautement improbable. D’ailleurs, on n’en parle même plus du tout de ces fameuses boites noires, qui en réalité n’est rien d’autre qu’un très mauvais effet d’annonce gouvernemental.

  3. Personnellement j’ai toujours été contre la surveillance généraliste. Mais c’est vrai que l’idée de boites noires n’est pas mauvaise je pense, mais il faut que ça dépasse l’effet d’annonce.

Laisser un commentaire