Internet, c’est quoi ?

Aujourd’hui, je vous présente un article sur ce qu’est Internet, et comment ça marche. Quand je parle d’Internet, je ne parle pas du World Wide Web, des sites Internet, je parle d’Internet en tant que réseau informatique.

Définition

Commençons par une citation tirée de Wikipédia :

« Internet est un système mondial d’interconnexion de réseaux informatiques, utilisant un ensemble standardisé de protocoles de transfert de données. C’est donc un réseau de réseaux, sans centre névralgique, composé de millions de réseaux aussi bien publics, privés, universitaires, commerciaux et gouvernementaux. Internet transporte un large spectre d’information et permet l’élaboration d’applications et de services variés comme le courrier électronique, la messagerie instantanée et le World Wide Web. »

Un réseau informatique, c’est quoi ? De manière basique, c’est quelque chose qui permet à plusieurs ordinateurs de communiquer entre eux, de manière simultanée (contrairement à un réseau téléphonique qui ne permet de communiquer qu’avec une seule personne en même temps). Internet, c’est donc la mise en commun de milliers de réseaux informatiques différents. Ça marche parce que tous ces réseaux utilisent les mêmes normes pour communiquer entre eux.

Update : paquets et routeurs

Sur un réseau informatique, l’information est découpée en petits « paquets ». Quand vous téléchargez une vidéo, cette dernière est trop grosse pour être envoyée d’un coup du serveur à votre ordinateur. Le serveur découpe donc cette dernière, envoie toutes les pièces du puzzle indépendamment à votre ordinateur et votre ordinateur reconstitue le puzzle à la fin.

Les composants physiques principaux d’un réseau sont les routeurs. Ce sont des ordinateurs un peu spéciaux dont la tâche principale est de décider où va un paquet donné. Imaginez un employé de la SNCF qui a pour tâche de bien aiguiller les trains, et bien c’est à peu près pareil en remplaçant les trains par les paquets d’information : « Ce train-là va à Paris, je l’envoie donc sur la voie 3. Ce train-ci va à Brest, je l’envoie sur la voie 1. »

Ce qui compose Internet

Internet étant le regroupement de milliers de réseaux, Internet n’a pas de centre : il n’y a pas un point par lequel transite toute l’information. En réalité, Internet est subdivisé en plusieurs entités appelées Autonomous Systems (AS). Les AS sont (généralement) des entités administratives distinctes : entreprises, universités… Par exemple le MIT et KTH ont leur propre numéro d’AS, tout comme Orange, Google et le FBI. Ces AS sont interconnectés. Bien sûr chaque AS n’est pas connecté avec tous les autres (il y en a environ 60 000), mais chaque AS a quelques voisins qui eux même sont connectés à d’autres AS, ainsi de suite… Donc, quand un message veut aller d’un AS à un autre, il suit un chemin et va d’AS en AS jusqu’à arriver à destination. Par exemple, prenez ce traceroute (ça indique le chemin entre moi et la destination, ici KTH) :

$ traceroute www.kth.se
traceroute to lvs-vip-6.sys.kth.se (130.237.32.143), 64 hops max, 52 byte packets
 1   (192.168.X.X)  13.949 ms  10.239 ms  1.497 ms
 2  something.tele2.se (X.X.X.X)  1.498 ms  2.508 ms  1.476 ms
 3  avk1-pe-1.port-channel2.tele2.net (130.244.9.177)  5.232 ms  7.709 ms  1.949 ms
 4  avk-pe-1.tengigabiteth2-4.tele2.net (130.244.49.249)  3.113 ms  1.893 ms  2.150 ms
 5  avk1-core-1.bundle-ether4.tele2.net (130.244.49.28)  3.612 ms  6.571 ms  3.659 ms
 6  netnod-ix-ge-b-sth.sunet.se (194.68.128.19)  1.981 ms  2.173 ms  2.009 ms
 7  m1tug-ae0-v1.sunet.se (130.242.83.42)  1.933 ms
    t1fre-ae0-v1.sunet.se (130.242.83.37)  2.844 ms
    m1tug-ae0-v1.sunet.se (130.242.83.42)  2.340 ms
 8  m1fre-ae1-v1.sunet.se (130.242.83.45)  2.384 ms
    m1fre-ae0-v1.sunet.se (130.242.83.50)  2.458 ms
    m1fre-ae1-v1.sunet.se (130.242.83.45)  3.149 ms
 9  ls-kth-br1.sunet.se (193.11.0.194)  2.399 ms  5.197 ms  5.390 ms
10  cn6-br1g-p2p.gw.kth.se (130.237.0.2)  2.880 ms  2.571 ms  2.515 ms
11  vss1-cn6-p2p.gw.kth.se (130.237.211.117)  446.094 ms  384.580 ms  271.835 ms
12  lvs-vip-6.sys.kth.se (130.237.32.143)  3.833 ms  2.968 ms  2.978 ms

Les lignes 2 à 5 indiquent que le chemin passe d’abord par l’AS de Tele2 (mon fournisseur d’accès à Internet), ensuite il passe par sunet (6 à 9) et arrive ensuite à KTH (10, 11 et 12). La question qui se pose maintenant, c’est la manière dont les AS communiquent entre eux. La réponse tient dans l’utilisation de BGP (Border Gateway Protocol).

BGP, entre les AS

Update : Vous vous souvenez de ce qu’est un routeur ? Bien. Il existe en réalité deux types de routeurs : ceux qui sont à l’intérieur d’un AS et ceux qui sont à sa frontière. Ceux qui sont à sa frontière ont la tâche de communiquer avec leurs homologues dans d’autres AS. Ils sont appelés border routers (border = frontière en anglais).

BGP est un protocole utilisé par les « border » routeurs d’un AS pour communiquer avec les border routeurs d’un autre AS. Ces routeurs s’échangent des informations grâce à ce protocole. Ces informations sont des informations de routage. Par exemple, l’AS 2 peut dire à l’AS 1 la chose suivante : « je sais aller à l’AS 18 en passant par l’AS 5, puis l’AS 10, puis l’AS 8, puis l’AS 18 ». Si dans le même temps, l’AS 3 dit à l’AS 1 « je sais aller à l’AS 18 en passant par l’AS 8 puis par l’AS 18 » alors l’AS 1 saura qu’il vaut mieux pour lui envoyer ses messages à l’AS 3 plutôt qu’à l’AS 2 s’il veut joindre l’AS 18.

À son tour, l’AS 1 va informer ses voisins des AS qu’il peut joindre, lui, en ajoutant son propre numéro à la liste. De manière assez intuitive, ce mécanisme permet de trouver le plus court chemin entre deux AS.

Là où ça se complique c’est que trouver le plus court chemin entre deux AS n’est qu’un des buts de BGP. Ce protocole permet aussi de définir des politiques comme « je ne veux pas que mon traffic passe par l’AS 3, donc même si le chemin est plus court par là, je vais quand même passer par l’AS 2 ». Les différentes règles que l’on peut paramétrer sont passablement complexes, je ne vais donc pas rentrer dans les détails. Mais la raison d’être de ces dernières est essentiellement économique : le traffic coute cher (en matériel, en accords commerciaux avec les autres AS), donc moins on en a, le mieux on se porte.

Comme je viens de le mentionner, il existe des accords commerciaux entre les différents AS. Ces accords commerciaux dépendent de la « symétrie » du traffic entre les deux AS. Si la bande passante utilisée dans un sens est à peu près la même que celle utilisée dans l’autre sens alors il se peut qu’il n’y ait pas d’argent échangé. Par contre s’il y a une grosse asymétrie alors, ça devient problématique. Prenons un FAI, type Orange, et un fournisseur de contenu, type YouTube. Le débit YouTube vers Orange est beaucoup plus important que le débit Orange vers YouTube parce que les abonnés de chez Orange aiment les vidéos de YouTube et que les employés de YouTube n’ont à peu près rien à faire du contenu hébergé chez Orange. YouTube est donc perçu comme une nuisance chez Orange, puisque générateur de traffic, donc de coûts, de problèmes etc. Orange va alors faire payer la différence à YouTube.

Bon, en vrai, je ne sais pas si Orange et YouTube sont connectés directement, mais c’était à titre d’exemple.

 

À l’intérieur d’un AS

Une fois que le paquet d’information est arrivé dans le bon AS, il faut encore qu’il soit distribué à la bonne adresse. Comment est-ce que Free sait où amener ce bout de vidéo que vous venez de demander ? Et bien les routeurs de Free utilisent des protocoles de routage. Les trois plus connus sont RIP, OSPF et IS-IS. Leur fonctionnement est assez différent et pas très important pour ce que je veux expliquer. La seule chose importante à savoir, c’est qu’ils font à peu près la même chose.

Chaque routeur est responsable pour une plage d’adresse (généralement ce sont des adresses IP, mais ça peut aussi être des adresses IPv6 ou encore autre chose). Chaque routeur dit « Moi, je suis responsable pour les adresses entre X et Y, si vous avez des paquets pour une de ces adresses, envoyez-les moi ». Ensuite, le protocole de routage se charge de transmettre ce message à tous les routeurs à l’intérieur de l’AS. La différence principale entre RIP, d’une part, et OSPF et IS-IS, d’autre part, c’est que dans les deux derniers, chaque routeur connait exactement le routeur de destination d’un paquet alors que dans RIP, il ne connait que la direction dans laquelle il faut envoyer le paquet.

Entre vous et votre FAI

Chez vous, vous avez un modem (peut-être caché dans une box, mais vous en avez un). Ce modem est connecté directement à un routeur. Votre FAI assigne une adresse au modem (adresse qui est dans la plage de responsabilité du routeur). Et c’est à peu près tout ! Une fois que vous avez votre adresse, vous pouvez communiquer (théoriquement) avec le monde entier. Pour mieux comprendre, nous allons voir un exemple entier.

Exemple & résumé

Vous êtes abonné chez le FAI Foo (qui est un AS). Vous voulez accéder au site internet www.site.com. Qu’est-ce qui se passe exactement ? Revoyons toutes les étapes :

  • Votre navigateur détermine l’adresse IP du site www.site.com grâce à une requête DNS. La réponse est quelque chose comme « www.site.com se trouve à l’adresse a.b.c.d ».
  • Votre ordinateur envoie un message « GET / » à l’adresse a.b.c.d. Ce message est contenu dans un paquet qui porte donc comme adresse de destination a.b.c.d.
  • Ce paquet arrive au premier routeur de Foo (celui qui est le plus proche de vous). Là, plusieurs choses peuvent se passer, mais la plupart du temps, ce routeur a une règle du genre « si je ne connais pas l’adresse de destination d’un paquet, alors je l’envoie à cet endroit » (c’est une route par défaut). Cette destination par défaut, c’est généralement un border router (un de ceux qui utilisent BGP) et lui sait où il faut envoyer le paquet qui a l’adresse a.b.c.d.
  • Il sait que l’adresse a.b.c.d se trouve chez l’AS Bar. Il sait que pour joindre Bar, il doit envoyer le paquet à Toto qui, lui, le transmettra à Tutu qui le transmettra à son tour à Bar. Bar envoie donc le paquet à l’AS Toto.
  • Toto reçoit le paquet et sait que pour joindre a.b.c.d, il doit envoyer le paquet à Bar à travers Tutu. Il envoie donc le paquet à Tutu qui fait la même chose et envoie le paquet à Bar.
  • Bar reçoit le paquet et voit que l’adresse de destination est une de ses adresses à lui. Il cherche lequel de ses routeurs est responsable pour cette adresse et route le paquet jusqu’à lui.
  • Ce routeur envoie alors le paquet à www.site.com.
  • www.site.com traite la requête et veut répondre avec une page web. Cette page web va être envoyé à votre adresse, x.y.c.z, qui était contenue dans le champs « expéditeur » du premier paquet. Cette page web est aussi contenue dans un paquet et ce paquet va être acheminé chez vous exactement de la même manière.
Et là il me faudrait un petit schéma pour que ce soit plus compréhensible, mais comme je suis feignant, je reporte ça à plus tard.
Voilà, j’espère que cette vulgarisation vous a plu et que vous comprenez maintenant un peu mieux un outil que vous utilisez sans doute tous les jours !
Update : précisions ici et là.

 

Related Posts:

Du vrai problème

Je vais aujourd’hui dévier de mes sujets habituels pour rentrer dans un sujet un peu plus polémique : la campagne présidentielle française et ses sujets. Enfin plutôt l’absence du sujet qui pourtant devrait être au centre de toutes les préoccupations : l’énergie. L’accident nucléaire de Fukushima a mis, il y a quelques mois le nucléaire au centre de toutes les attentions. En a résulté l’accord EE-Les Verts/PS et le problème énergétique a été discuté pendant la primaire du PS. Pour rappel, cet accord prévoit la “fermeture progressive de 24 réacteurs” nucléaires sur les 58 que compte la France. Je vais expliquer ici pourquoi je pense que cet accord est une idée désastreuse et pourquoi, si son application est effective1, le programme de François Hollande sera inapplicable. Je ne vais pas expliquer ici pourquoi il me semble que sortir du nucléaire pour des raisons de sécurité me parait totalement illogique, cet article le fait très bien.

D’abord, un petit historique : la France n’a eu une croissance supérieure à 3% que 5 fois depuis 1979 (fin des Trente Glorieuses) et la dernière fois remonte à plus de 10 ans2. Malgré cela, les programmes des principaux partis politiques tablent sur une croissance de 3% pour financer leur programme et résoudre les problèmes de la France : emplois, retraite, sécurité sociale… Hors, sans une politique énergétique rigoureuse et bien pensée, nous n’arriverons jamais à ce chiffre. Voici les raisons.

L’augmentation du prix des énergies fossiles

Bernard Bigot (Administrateur Général du Commissariat à l’énergie atomique et aux énergies alternatives) a pointé du doigt le fait que “nous [ayons] dépensé 62 milliards d’euros en gaz et pétrole en 2010 contre 23 milliards il y a 5 ans” pour une consommation à peu près équivalente (entre 260 et 265 millions de TEP — Tonne d’équivalent pétrole). Autrement dit, en 5 ans, nous avons dépensé 39 milliards d’euros de plus seulement à cause de l’augmentation du prix de l’énergie fossile. Pour vous donner un ordre d’idée, le budget de l’Éducation Nationale, c’est 62 milliards, le budget de la Recherche de l’Enseignement Supérieur, c’est 25,5 milliards3. Ce genre de comparaison permet de comprendre que si l’on résout le problème de l’énergie, alors il y a des chances qu’on ait les moyens de résoudre beaucoup d’autres problèmes.

La part du nucléaire dans l’énergie française

Comme dit précédemment, la France consomme à peu près 265 millions de TEP par an. Ce chiffre se décompose comme suit :

  • gaz, pétrole, charbon : 133,5 millions de TEP
  • énergies renouvelables thermiques (ENRt : bois, solaire thermique…) : 17,1 millions de TEP
  • électricité (tout confondu : nucléaire, hydraulique, éolien…) : 115,1 millions de TEP

Nous avons vu que l’augmentation du prix des énergies fossiles rend obligatoire la diminution de leur part. Nous n’arriverons jamais à réduire notre consommation de manière assez importante pour absorber une diminution telle qu’elle va nous être imposée4. Nous devons donc reporter au moins une part des énergies fossiles sur le reste. Nous avons donc deux choix : le renouvelable et le nucléaire. Ce que nous disent les anti-nucléaires, c’est de supprimer le nucléaire (logique, non ?). Il faudrait donc le remplacer par du renouvelable ou du fossile. Nous avons vu qu’avec le fossile, nous courons à notre perte (coucou, nos amis allemands), il faut donc se reporter sur le renouvelable. Malheureusement, ce n’est pas possible, du moins à court/moyen terme.

Les problèmes des énergies renouvelables

Moi, les énergies renouvelables, j’aime bien. Sur le papier, c’est tout joli, tout beau. Le gros problème, c’est que nous ne sommes pas près de remplacer le fossile par le renouvelable. Et cela pour plusieurs raisons :

  • La quasi-totalité des énergies renouvelables n’ont pas une production constante : l’éolien dépend du vent, le solaire du Soleil etc. (c’est la journée des lapalissades). C’est un problème à cause du point suivant.
  • Nous ne savons pas stocker l’électricité. Nous sommes obligés de la produire en même temps qu’elle est consommée. Par exemple, les pics de consommation ont lieu lors des soirs de grand froid (quand il n’y a ni Soleil, ni vent…). Les énergies renouvelables ne peuvent donc pas assurer la production en ces moments là et le relais doit être pris par une autre source : fossile ou nucléaire, à choisir.
  • Les énergies renouvelables sont encore chères. Dans une société ou le pouvoir d’achat est un problème majeur, c’est une composante à ne pas laisser de côté.
  • La réticence de la population à voir des installations gigantesques (fermes solaires, champs d’éoliennes…) près de chez eux.

Conclusion

Pour survivre économiquement, nous devons vite trouver une solution pour réduire notre consommation d’énergie fossile. Pour cela, nous ne pouvons pas (encore) utiliser les énergies renouvelables : ce n’est pas économiquement viable et le gain en émissions de CO2 n’est pas si grand si nous devons utiliser des usines thermiques pour combler les creux de production. Le nucléaire est donc, pour l’instant, la seule solution.

Pour ceux qui veulent plus de lecture sur le sujet :

  • Cet article, et plus généralement tout le blog.
  • Cette interview de Jean-Marc Jancovici et tout le site.
  • Cette interview de Michel Rocard.

C’était mon premier article de ce genre, je ne suis pas sûr d’avoir très bien réussi l’exercice. Je vous invite à débattre aussi bien sur le fond que sur la forme dans les commentaires :-)

PS : je dédie cet article à Kate Romm, une traductrice régulière selon mes informations :-) Bonjour Mademoiselle !

  1. Ce qui est loin d’être acquis, vu les scores d’Eva Joly…
  2. Source : Insee
  3. Source : OpenData
  4. Le prix du SP95 a dépassé les 2€ à Paris pour ceux qui n’avaient pas suivi…

Related Posts:

  • No Related Posts