World Wide Web

ï»ż
World Wide Web
Page d'aide sur l'homonymie Ne doit pas ĂȘtre confondu avec Internet.

Le World Wide Web (WWW), littĂ©ralement la « toile (d’araignĂ©e) mondiale Â», communĂ©ment appelĂ© le Web, le web, parfois la Toile, est un systĂšme hypertexte public fonctionnant sur Internet qui permet de consulter, avec un navigateur, des pages accessibles sur des sites. L’image de la toile d'araignĂ©e vient des hyperliens qui lient les pages web entre elles[1].

Le Web n’est qu’une des applications d’Internet. D’autres applications sont le courrier Ă©lectronique, la messagerie instantanĂ©e et Usenet. Le Web a Ă©tĂ© inventĂ© plusieurs annĂ©es aprĂšs Internet, mais c’est lui qui a rendu les mĂ©dias grand public attentifs Ă  Internet. Depuis, le Web est frĂ©quemment confondu avec Internet ; en particulier, le mot Toile est souvent utilisĂ© dans les textes non techniques sans qu’il soit clairement exprimĂ© s’il dĂ©signe le Web ou Internet.

Logo historique du World Wide Web par Robert Cailliau.

Sommaire

Terminologie

Termes désignant le World Wide Web

Le World Wide Web est dĂ©signĂ© par de nombreux noms et abrĂ©viations synonymes : WorldWideWeb, World Wide Web, World-wide Web, Web, WWW, W3, Toile d’araignĂ©e mondiale, Toile mondiale, Toile. Certains ont disparu.

Le nom du projet originel Ă©tait WorldWideWeb[2]. Les mots ont Ă©tĂ© rapidement sĂ©parĂ©s en World Wide Web pour amĂ©liorer la lisibilitĂ©. Le nom World-Wide Web a Ă©galement Ă©tĂ© utilisĂ© par les inventeurs du Web, mais le nom dĂ©sormais prĂ©conisĂ© par le World Wide Web Consortium (W3C) sĂ©pare les trois mots sans trait d’union[3]. Bien que « mondial Â» s’écrive world-wide ou worldwide en anglais, l’orthographe World Wide Web et l’abrĂ©viation Web sont maintenant bien Ă©tablies.

En inventant le Web, Tim Berners-Lee avait aussi pensĂ© Ă  d’autres noms, comme Information Mesh (maillage d’informations), Mine of Information ou encore The Information Mine (la mine d’informations, dont le sigle serait Tim).

Le sigle WWW a Ă©tĂ© largement utilisĂ© pour abrĂ©ger World Wide Web avant que l’abrĂ©viation Web ne prenne le pas. WWW se prononce souvent trois double V, triple double V, ou vĂ©vĂ©vĂ©. La prononciation laborieuse (en français comme en anglais) de WWW a sans doute prĂ©cipitĂ© son dĂ©clin Ă  l'oral. À l'Ă©crit, les lettres www restent trĂšs utilisĂ©es dans les adresses Web et quelques autres conventions techniques. WWW est parfois abrĂ©gĂ© en W3, abrĂ©viation qu’on retrouve dans le sigle W3C du World Wide Web Consortium. Dans la seconde moitiĂ© des annĂ©es 1990, une blague rĂ©pandue prĂ©tendait que WWW signifiait World Wide Wait, soit « attente mondiale Â», car le rĂ©seau Internet Ă©tait engorgĂ© par la popularitĂ© grandissante du Web.

Pour Ă©crire « le web Â», l’usage de la minuscule est de plus en plus courant. L’Office quĂ©bĂ©cois de la langue française prĂ©conise la majuscule[4], le Journal officiel français prĂ©conise « la toile d’araignĂ©e mondiale[5] Â». Cet article fait la distinction entre « le Web Â» et « un web Â», aussi la majuscule est toujours utilisĂ©e pour dĂ©signer le Web.

Termes rattachés au Web

La terminologie propre au Web contient plusieurs dizaines de termes. Ce chapitre expose ceux qui sont utilisés dans cet article.

L’expression en ligne signifie « connectĂ© Ă  un rĂ©seau Â», en l’occurrence le rĂ©seau informatique Internet. Cette expression n’est pas propre au Web, on la retrouve Ă  propos du tĂ©lĂ©phone.

Un hĂŽte est un ordinateur en ligne. Chaque hĂŽte d’Internet est identifiĂ© par une adresse IP Ă  laquelle correspondent zĂ©ro, un ou plusieurs noms d’hĂŽte. Cette terminologie n’est pas propre au Web, mais Ă  Internet.

Une ressource du World Wide Web est une entitĂ© informatique (texte, image, forum Usenet, boĂźte aux lettres Ă©lectronique, etc.) accessible indĂ©pendamment d’autres ressources. Une ressource en accĂšs public est librement accessible depuis Internet. Une ressource locale est prĂ©sente sur l’ordinateur utilisĂ©, par opposition Ă  une ressource distante (ou en ligne), accessible Ă  travers un rĂ©seau.

On ne peut accĂ©der Ă  une ressource distante qu’en respectant un protocole de communication. Les fonctionnalitĂ©s de chaque protocole varient : rĂ©ception, envoi, voire Ă©change continu d’informations.

HTTP (pour HyperText Transfer Protocol) est le protocole de communication communément utilisé pour transférer les ressources du Web. HTTPS est la variante sécurisée de ce protocole.

Une URL (pour Uniform Resource Locator) pointe sur une ressource. C’est une chaüne de caractùres permettant d’indiquer un protocole de communication et un emplacement pour toute ressource du Web.

Un hyperlien (ou lien) est un Ă©lĂ©ment dans une ressource associĂ© Ă  une URL. Les hyperliens du Web sont orientĂ©s : ils permettent d’aller d’une source Ă  une destination. Seule la ressource Ă  la source contient les donnĂ©es dĂ©finissant l’hyperlien, la ressource de destination n’en porte aucune trace. Il existe deux types d’hyperlien : ceux du premier type doivent ĂȘtre activĂ©s pour accĂ©der Ă  la destination ; ceux du second causent un accĂšs automatique Ă  la destination.

HTML (pour HyperText Markup Language) et XHTML (Extensible HyperText Markup Language ) sont les langages informatiques permettant de dĂ©crire le contenu d’un document (titres, paragraphes, disposition des images, etc.) et d’y inclure des hyperliens. Un document HTML est un document dĂ©crit avec le langage HTML. Les documents HTML sont les ressources les plus consultĂ©es du Web.

Dans un mode de communication client-serveur, un serveur est un hĂŽte sur lequel fonctionne un logiciel serveur auquel peuvent se connecter des logiciels clients fonctionnant sur des hĂŽtes clients.

Un serveur Web est un hĂŽte sur lequel fonctionne un serveur HTTP (ou serveur Web). Un serveur Web hĂ©berge les ressources qu’il dessert.

Un navigateur Web est un logiciel client HTTP conçu pour accĂ©der aux ressources du Web. Sa fonction de base est de permettre la consultation des documents HTML disponibles sur les serveurs HTTP. Le support d’autres types de ressource et d’autres protocoles de communication dĂ©pend du navigateur considĂ©rĂ©.

Une page Web (ou page) est un document destinĂ© Ă  ĂȘtre consultĂ© avec un navigateur Web. Une page Web est toujours constituĂ©e d’une ressource centrale (gĂ©nĂ©ralement un document HTML) et d’éventuelles ressources liĂ©es automatiquement accessibles (typiquement des images).

Un Ă©diteur HTML (ou Ă©diteur Web) est un logiciel conçu pour faciliter l’écriture de documents HTML et de pages Web en gĂ©nĂ©ral.

Un site web (ou site) est un ensemble de pages Web et d’éventuelles autres ressources, liĂ©es dans une structure cohĂ©rente, publiĂ©es par un propriĂ©taire (une entreprise, une administration, une association, un particulier, etc.) et hĂ©bergĂ©es sur un ou plusieurs serveurs Web.

Visiter un site Web signifie « consulter ses pages Â». Le terme visite vient du fait que l’on consulte gĂ©nĂ©ralement plusieurs pages d’un site, comme on visite les piĂšces d’un bĂątiment. La visite est menĂ©e par un utilisateur (ou visiteur ou internaute). La mesure d’audience est obtenue en copiant le code en javascript d’un lien vers le site d’un prestataire spĂ©cialisĂ© suivant la technique du marqueur Ă  distance.

Une adresse Web est une URL de page Web, gĂ©nĂ©ralement Ă©crite sous une forme simplifiĂ©e limitĂ©e Ă  un nom d’hĂŽte. Une adresse de site Web est en fait l’adresse d’une page du site prĂ©vue pour accueillir les visiteurs.

Un hébergeur Web est une entreprise de services informatiques hébergeant (mettant en ligne) sur ses serveurs Web les ressources constituant les sites Web de ses clients.

Une agence Web est une entreprise de services informatiques réalisant des sites Web pour ses clients.

L’expression surfer sur le Web signifie « consulter le Web Â». Elle a Ă©tĂ© inventĂ©e pour mettre l’accent sur le fait que consulter le Web consiste Ă  suivre de nombreux hyperliens de page en page. Elle est principalement utilisĂ©e par les mĂ©dias ; elle n’appartient pas au vocabulaire technique.

Un annuaire Web est un site Web répertoriant des sites Web.

Un portail Web est un site Web tentant de regrouper la plus large palette d’informations et de services possibles dans un site Web. Certains portails sont thĂ©matiques.

Un agrégateur Web est un site Web qui sélectionne, organise et, éventuellement, valide des pages (URL) concernant un sujet précis et de les met en forme de façon attractive.

Un service Web est une technologie client-serveur basée sur les protocoles du Web.

Architecture

ModÚle mathématique

Le World Wide Web, en tant qu’ensemble de ressources hypertextes, est modĂ©lisable en graphe orientĂ© possĂ©dant des cycles avec les ressources pour sommets et les hyperliens pour arcs. Du fait que le graphe est orientĂ©, certaines ressources peuvent constituer des puits, ou moins formellement des cul-de-sac[6] : il n’existe aucun chemin vers le reste du Web. À l’inverse, certaines ressources peuvent constituer des sources : il n’existe aucun chemin depuis le reste du Web.

Les analyses ont montrĂ© que la structure du Web rĂ©pondait au modĂšle des rĂ©seaux libres d'Ă©chelle[7] prĂ©sent dans la plupart des rĂ©seaux sociaux. Cela se traduit par la prĂ©sence de moyeux, les hubs, vers lesquels convergent les liens hypertextes : ce sont les sites les plus importants qui constituent le squelette du Web.

Techniquement, rien ne distingue le World Wide Web d’un quelconque autre Web utilisant les mĂȘmes technologies. Ainsi, d’innombrables Webs privĂ©s existent. Dans la pratique, on considĂšre qu’une page d’un site web populaire, comme un annuaire Web, fait partie du Web. Le Web peut alors ĂȘtre dĂ©fini comme Ă©tant l’ensemble des ressources et des hyperliens que l’on peut rĂ©cursivement dĂ©couvrir Ă  partir de cette page, ce qui exclut les sources et les Webs privĂ©s.

Exploration du Web et Web profond

Article dĂ©taillĂ© : Robot d'indexation.

L’exploration rĂ©cursive du Web Ă  partir de ressources bien choisies est la mĂ©thode de base programmĂ©e dans les robots d’indexation des moteurs de recherche. En 2004, les moteurs de recherche indexent environ 4 milliards de ressources.

Le Web profond, ou Web invisible, est la partie du Web qui n’est pas indexĂ©e et donc introuvable avec les moteurs de recherche gĂ©nĂ©ralistes. Des Ă©tudes indiquent que la partie invisible du Web reprĂ©sente plus de 99 % du Web[8]. Le Web profond comprend notamment les ressources suivantes :

  • les ressources inaccessibles au public, donc aux robots, notamment les pages administratives ou payantes, protĂ©gĂ©es par un mot de passe ;
  • les ressources qui ne sont pas communiquĂ©es par des protocoles de communication pris en charge par les robots (souvent ils ne prennent en charge que HTTP et HTTPS) ;
  • les ressources dont le format de donnĂ©es n'est pas pris en charge par le robot ;
  • les ressources listĂ©es dans un fichier d’exclusion des robots ;
  • les ressources exclues par le robot car elles sont conçues pour abuser du rĂ©fĂ©rencement (spamdexing) ;
  • les ressources exclues par le robot car elles sont considĂ©rĂ©es comme trop peu pertinentes (par exemple si un site contient des millions de ressources qui ne sont liĂ©es par aucun autre site) ;
  • les ressources vers lesquelles les hyperliens sont crĂ©Ă©s dynamiquement en rĂ©ponse aux interrogations des visiteurs.

Ces derniÚres ressources proviennent généralement de bases de données et constituent la partie la plus importante du Web profond.

Serveurs publics

L’exploration rĂ©cursive n’est pas le seul moyen utilisĂ© pour indexer le Web et mesurer sa taille. L’autre solution consiste Ă  mesurer l’infrastructure informatique connectĂ©e Ă  Internet pour hĂ©berger des sites Web. Au lieu de suivre des hyperliens, cette mĂ©thode consiste Ă  utiliser les noms de domaine enregistrĂ©s dans le Domain Name System et essayer de se connecter Ă  tous les serveurs Web potentiels. C’est notamment la mĂ©thode utilisĂ©e par la sociĂ©tĂ© Netcraft, qui publie rĂ©guliĂšrement les rĂ©sultats de ses explorations, dont les mesures de popularitĂ© des serveurs HTTP. Cette mesure porte plus sur l’utilisation des technologies du Web que sur le Web lui-mĂȘme. Elle permet notamment de trouver des sites publics qui ne sont pas liĂ©s au World Wide Web.

Intranets et Webs privés

Un site Web mis en ligne sur un intranet est privé, car le public ne peut pas accéder à un intranet.

En outre, si l'on met en ligne un site Web sur Internet en omettant de créer des liens depuis au moins une page existante du World Wide Web, alors ce site constitue un web isolé. Il est virtuellement privé, car le public ne peut pas le découvrir en suivant des hyperliens.

Archivage

Article dĂ©taillĂ© : Archivage du Web.

Le Web change constamment : les ressources ne cessent d’ĂȘtre crĂ©Ă©es, modifiĂ©es et supprimĂ©es. Il existe quelques initiatives d’archives du Web dont le but est de permettre de retrouver ce que contenait un site Ă  une date donnĂ©e. Le projet Internet Archive est l’un d’eux.

Types de ressource

Les divers types de ressource du Web ont des usages assez distincts :

Documents HTML

Le document HTML est la principale ressource d’une page Web, celle qui contient les hyperliens, qui contient et structure le texte, qui lie et dispose les ressources multimĂ©dias. Un document HTML contient uniquement du texte : le texte consultĂ©, le texte en langage HTML plus d’éventuels autres langages de script ou de style.

La prĂ©sentation de documents HTML est la principale fonctionnalitĂ© d’un navigateur Web. HTML laisse au navigateur le soin d’exploiter au mieux les capacitĂ©s de l’ordinateur pour prĂ©senter les ressources. Typiquement, la police de caractĂšre, la longueur des lignes de texte, les couleurs, etc, doivent ĂȘtre adaptĂ©es au pĂ©riphĂ©rique de sortie (Ă©cran, imprimante, etc).

Multimédia

Les Ă©lĂ©ments multimĂ©dias proviennent toujours de ressources indĂ©pendantes du document HTML. Les documents HTML contiennent des hyperliens pointant sur les ressources multimĂ©dias, qui peuvent donc ĂȘtre Ă©parpillĂ©es sur Internet. Les Ă©lĂ©ments multimĂ©dias liĂ©s sont automatiquement transfĂ©rĂ©s pour prĂ©senter une page Web.

Seul l’usage des images et des petites animations est standardisĂ©. Le support du son, de la vidĂ©o, d’espaces tridimensionnels ou d’autres Ă©lĂ©ments multimĂ©dias repose encore sur des technologies non standardisĂ©es. De nombreux navigateurs Web proposent la possibilitĂ© de greffer des logiciels (plugin) pour Ă©tendre leurs fonctionnalitĂ©s, notamment le support de types de mĂ©dia non standard.

Les flux (audio, vidĂ©o) nĂ©cessitent un protocole de communication au fonctionnement diffĂ©rent de HTTP. C’est une des raisons pour lesquelles ce type de ressource nĂ©cessite souvent un plugin et est mal intĂ©grĂ© aux pages Web.

Images

Ce chapitre concerne les images intégrées aux pages Web.

L’usage du format de donnĂ©es JPEG est indiquĂ© pour les images naturelles, principalement les photographies.

L’usage du format de donnĂ©es PNG est indiquĂ© pour les images synthĂ©tiques (logos, Ă©lĂ©ments graphiques). Il est aussi indiquĂ© pour les images naturelles, mais uniquement lorsque la qualitĂ© prime totalement sur la durĂ©e du transfert.

L’usage du format de donnĂ©es GIF est indiquĂ© pour les petites animations. Pour les images synthĂ©tiques, la popularitĂ© ancienne de GIF le fait souvent prĂ©fĂ©rer Ă  PNG. Cependant, GIF souffre de quelques dĂ©savantages, notamment la limitation du nombre de couleurs et un degrĂ© de compression gĂ©nĂ©ralement moindre. En outre une controverse a entourĂ© l’usage de GIF de 1994 Ă  2004 car Unisys a fait valoir un brevet couvrant la mĂ©thode de compression.

L’usage d’images de format de donnĂ©es XBM est obsolĂšte.

Vidéo

Jusque dans les années 2000, la consultation de musique et vidéo demandait l'installation d'un programme ad hoc (un plugin) pour étendre les fonctionnalités du navigateur Web. La trÚs grande diffusion du plugin Flash Player a finalement rendu la consultation vidéo aussi simple que celle ces images. Finalement, la cinquiÚme version langage HTML (HTML 5) a intégré la vidéo.

Scripts et animations

Un langage de script permet d’écrire le texte d’un programme directement exĂ©cutĂ© par un logiciel. Dans le cadre du Web, un script est exĂ©cutĂ© par un navigateur Web et programme des actions rĂ©pondant Ă  l’usage que le visiteur fait de la page Web consultĂ©e. Un script peut ĂȘtre intĂ©grĂ© au document HTML ou provenir d’une ressource liĂ©e. Le premier langage de script du Web fut JavaScript, dĂ©veloppĂ© par Netscape. Ensuite Microsoft a dĂ©veloppĂ© une variante concurrente sous le nom de JScript. Finalement, la norme ECMAScript a Ă©tĂ© proposĂ©e pour la syntaxe du langage, et les normes DOM pour l’interface avec les documents.

De technologie aux capacitĂ©s d'actions trĂšs limitĂ©es Ă  ses dĂ©buts, le langage JavaScript est devenu capable d'exĂ©cuter toutes les applications imaginables : traitement de texte, jeu vidĂ©o, Ă©mulateur, etc.

Encore plus que pour la vidéo, le plugin Flash Player est devenu trÚs largement utilisé pour la diffusion d'animations. Parfois des sites entiers sont réalisés en Flash.

Styles

Le langage CSS a Ă©tĂ© dĂ©veloppĂ© pour gĂ©rer en dĂ©tail la prĂ©sentation des documents HTML. Le texte en langage CSS peut ĂȘtre intĂ©grĂ© au document HTML ou provenir de ressources liĂ©es, les feuilles de style. Cette sĂ©paration permet une gestion sĂ©parĂ©e de l’information (contenue dans des documents HTML) et de sa prĂ©sentation (contenue dans des feuilles de style). On parle aussi de « sĂ©paration du fond et de la forme Â».

Autres

La gestion des autres types de ressource dĂ©pend des logiciels installĂ©s sur l’hĂŽte client et de leurs rĂ©glages.

Lorsque le logiciel correspondant est disponible, les documents et images de tout type sont gĂ©nĂ©ralement automatiquement prĂ©sentĂ©s, selon des modalitĂ©s (fenĂȘtrage, dialogues) dĂ©pendant du navigateur Web et du logiciel gĂ©rant le type. Lorsque le type de la ressource n’est pas gĂ©rĂ©, il est gĂ©nĂ©ralement possible de la sauver dans un fichier local.

Pour gĂ©rer les ressources de systĂšmes diffĂ©rents du Web comme le courrier Ă©lectronique, les navigateurs font habituellement appel Ă  des logiciels sĂ©parĂ©s. Si aucun logiciel ne gĂšre un type de ressource, un simple message d’erreur l’indique.

Conception

Universalité

Le Web a Ă©tĂ© conçu pour ĂȘtre accessible avec les Ă©quipements informatiques les plus divers : station de travail, terminal informatique en mode texte, ordinateur personnel, tĂ©lĂ©phone portable, etc. Cette universalitĂ© d’accĂšs dĂ©pend en premier lieu de l’universalitĂ© des protocoles Internet. En second lieu, elle dĂ©pend de la flexibilitĂ© de prĂ©sentation des pages Web, offerte par HTML. En outre, HTTP offre aux navigateurs la possibilitĂ© de nĂ©gocier le type de chaque ressource. Enfin, CSS permet de proposer diffĂ©rentes prĂ©sentations, sĂ©lectionnĂ©es pour leur adĂ©quation avec l’équipement utilisĂ©.

Le W3C a pour cela créé des normes dans le but de permettre l'indépendance des outils qui servent à créer du contenu avec ceux qui servent à le lire. On appelle cela l'interopérabilité.

L’accessibilitĂ© du Web pour les individus handicapĂ©s est aussi l’objet d’attentions particuliĂšres comme la Web Accessibility Initiative.

DĂ©centralisation

Les technologies du Web n’imposent pas d’organisation entre les pages Web, ni a fortiori entre les sites web. Toute page du Web peut contenir un hyperlien vers toute autre ressource accessible d’Internet. L’établissement d’un hyperlien ne requiert absolument aucune action du cĂŽtĂ© de la ressource pointĂ©e. Il n’y a pas de registre centralisĂ© d’hyperliens, de pages ou de sites. Le seul registre utilisĂ© est celui du DNS, c’est une base de donnĂ©e distribuĂ©e qui rĂ©pertorie des hĂŽtes et est utile Ă  tous les systĂšmes basĂ©s sur Internet.

Cette conception dĂ©centralisĂ©e devait favoriser, et a favorisĂ©, une augmentation rapide de la taille du Web. Elle a aussi favorisĂ© l’essor de sites spĂ©cialisĂ©s dans les informations sur les autres sites : les annuaires et les moteurs de recherche. Sans ces sites, la recherche d’information dans le Web serait extrĂȘmement laborieuse. La dĂ©marche inverse, le portail Web, tente de concentrer un maximum d’informations et de services dans un seul site.

Une faiblesse de la dĂ©centralisation est le manque de suivi lorsqu’une ressource est dĂ©placĂ©e ou supprimĂ©e : les hyperliens qui la pointaient se retrouvent cassĂ©s. Et cela n’est visible qu’en activant l’hyperlien, le rĂ©sultat le plus courant Ă©tant le message d’erreur 404.

Technologies

Pré-existantes

Le Web repose sur les technologies d’Internet, notamment TCP/IP pour assurer le transfert des donnĂ©es, DNS pour convertir les noms d’hĂŽte en adresses IP et MIME pour indiquer le type des donnĂ©es. Les standards de codage de caractĂšres et les formats d’image numĂ©rique GIF et JPEG ont Ă©tĂ© dĂ©veloppĂ©s indĂ©pendamment.

Spécifiques

Trois technologies ont dĂ» ĂȘtre dĂ©veloppĂ©es pour le World Wide Web :

Ces premiĂšres technologies ont Ă©tĂ© normalisĂ©es comme les autres technologies d’Internet : en utilisant le processus des Request for Comments. Cela a donnĂ© le RFC 1738 pour les URL, le RFC 1866 pour HTML 2.0 et le RFC 1945 pour HTTP/1.0.

Le World Wide Web Consortium (W3C) a Ă©tĂ© fondĂ© en 1994 pour dĂ©velopper et promouvoir les nouveaux standards du Web. Son rĂŽle est notamment de veiller Ă  l’universalitĂ© des nouvelles technologies. Des technologies ont Ă©galement Ă©tĂ© dĂ©veloppĂ©es par des entreprises privĂ©es.

Actuelles

Les principaux standards actuels sont :

Technologies serveur

Outre les protocoles de communication et formats de donnĂ©es Ă©changĂ©s sur le Web, plusieurs techniques propres au Web sont mises en Ɠuvre pour faire fonctionner les serveurs Web. Comme ces techniques ne sortent pas du serveur, elles ne sont pas standardisĂ©es par le World Wide Web Consortium.

  • Le standard CGI (Common Gateway Interface) est un protocole de communication inter-processus entre le serveur HTTP et des applications externes.
  • Le langage de programmation PHP (PHP: Hypertext Preprocessor) a Ă©tĂ© dĂ©veloppĂ© pour gĂ©nĂ©rer les pages Web. Il jouit d’une forte intĂ©gration avec le serveur HTTP et les langages HTML.
  • Le moteur ASP (Active Server Pages) a Ă©tĂ© dĂ©veloppĂ© par Microsoft pour interprĂ©ter du langage de script dans le serveur IIS (Internet Information Services).

Historique

Article connexe : histoire d'Internet.

Tim Berners-Lee travaille comme informaticien Ă  l’Organisation europĂ©enne pour la recherche nuclĂ©aire (CERN) lorsqu’il propose, en 1989, de crĂ©er un systĂšme hypertexte distribuĂ© sur le rĂ©seau informatique pour que les collaborateurs puissent partager les informations au sein du CERN[9]. Cette mĂȘme annĂ©e, les responsables du rĂ©seau du CERN dĂ©cident d’utiliser le protocole de communication TCP/IP et le CERN ouvre sa premiĂšre connexion extĂ©rieure avec Internet[10].

L’annĂ©e suivante, l’ingĂ©nieur systĂšme Robert Cailliau se joint au projet d’hypertexte au CERN, immĂ©diatement convaincu de son intĂ©rĂȘt, et se consacre Ă©nergiquement Ă  sa promotion[11]. Tim Berners-Lee et Robert Cailliau sont reconnus comme les deux personnes Ă  l’origine du World Wide Web.

Jusqu’en 1993, le Web est essentiellement dĂ©veloppĂ© sous l’impulsion de Tim Berners-Lee et Robert Cailliau. Les choses changent avec l’apparition de NCSA Mosaic, un navigateur Web dĂ©veloppĂ© par Eric Bina et Marc Andreessen au National Center for Supercomputing Applications (NCSA), dans l’Illinois. NCSA Mosaic jette les bases de l’interface graphique des navigateurs modernes et cause un accroissement exponentiel de la popularitĂ© du Web. Le NCSA produit Ă©galement le NCSA HTTPd, un serveur HTTP qui Ă©voluera en Apache HTTP Server, le serveur HTTP le plus utilisĂ© depuis 1996.

En 1994, Netscape Communications Corporation est fondĂ©e avec une bonne partie de l’équipe de dĂ©veloppement de NCSA Mosaic. Sorti fin 1994, Netscape Navigator supplante NCSA Mosaic en quelques mois.

En 1995, Microsoft essaie de concurrencer Internet avec The Microsoft Network (MSN) et échoue. Fin 1995, aprÚs la sortie de Windows 95 sans le moindre navigateur Web préinstallé, Microsoft lance avec Internet Explorer la guerre des navigateurs contre Netscape Navigator.

Chronologie

Les premiÚres années de cet historique sont largement basées sur A Little History of the World Wide Web (Une petite histoire du World Wide Web).

  • 1989
    • Le 13 mars, Tim Berners-Lee, engagĂ© au CERN Ă  GenĂšve en 1984 pour travailler sur l’acquisition et le traitement des donnĂ©es[12], propose de dĂ©velopper un systĂšme hypertexte organisĂ© en Web, afin d’amĂ©liorer la diffusion des informations internes : Information Management: A Proposal[9].
  • 1990
    Le premier serveur Web, un NeXT Cube
  • 1991
    • Le 6 aoĂ»t, Tim Berners-Lee rend le projet WorldWideWeb public dans un message sur Usenet [2].
    • Étendue : premier serveur Web hors d’Europe au SLAC ; passerelle avec WAIS [3].
    • Logiciels : fichiers dĂ©veloppĂ©s au CERN disponibles par FTP.
  • 1992
    • Le World Wide Web est promu sur le World Wide Web [4].
    • Étendue : 26 sites web « raisonnablement fiables Â» [5].
    • Logiciels : navigateurs Erwise [6], ViolaWWW [7] ; serveur NCSA HTTPd.
  • 1993
    • Le 30 avril, le CERN met les logiciels du World Wide Web dans le domaine public [8]. À la fin de l’annĂ©e, les mĂ©dias grand public remarquent Internet et le WWW.
    • Étendue : 130 sites Web en juin, 623 en dĂ©cembre [9] ; l’usage croĂźt d’un rythme annuel de 341 634 %.
    • Logiciels : Apparitions des navigateurs NCSA Mosaic et Lynx. Disponible d’abord sur X Window, puis sur Windows et MacOS, Mosaic cause un phĂ©nomĂ©nal accroissement de la popularitĂ© du Web.
    • Technologies : images dans les pages Web (Mosaic 0.10) ; formulaires interactifs (Mosaic 2.0pre5).
  • 1994
    • Étendue : 2 738 sites en juin, 10 022 en dĂ©cembre.
    • Sites : Yahoo! crĂ©Ă© par deux Ă©tudiants ; apparition de la publicitĂ© sur HotWired.
    • Logiciels : Netscape Navigator 1.0.
    • Standards : fondation du World Wide Web Consortium ; RFC 1738 (Uniform Resource Locators).
  • 1995
  • 1996
    • Étendue : 100 000 sites en janvier, environ 230 000 en juin.
    • Logiciels : Netscape Navigator 2.0 et 3.0 ; Internet Explorer 3.0 ; Opera 2.1.
    • Standards : RFC 1945 (HTTP/1.0) ; CSS level 1.
    • Sites : Internet Archive commence Ă  archiver le Web.
  • 1997
    • Étendue : plus de 1 000 000 sites en avril selon Netcraft.
    • Logiciels : Netscape Navigator 4.0 ; Internet Explorer 4.0.
    • Standards : HTML 3.2 ; HTML 4.0.
  • 1998
    • America Online rachĂšte Netscape qui a perdu la guerre des navigateurs pour 4 milliards US$.
    • Étendue : plus de 2 000 000 sites en mars.
    • Logiciels : Netscape Navigator 4.5 ; projet Mozilla.
    • Sites : Google.
    • Standards : XML 1.0 ; CSS level 2 ; DOM level 1, WAP level 1.
  • 1999
    • Étendue : plus de 4 000 000 de sites en janvier, plus de 7 400 000 en aoĂ»t.
    • Logiciels : Internet Explorer 5.0.
    • Standards : HTML 4.01 ; RFC 2616 (HTTP/1.1).
  • 2000
    • Étendue : 11 161 854 sites en fĂ©vrier, 19 823 296 en aoĂ»t selon Netcraft [11].
    • Standards : XHTML 1.0.
  • 2001
    • Étendue : 27 585 719 sites en janvier, 30 775 624 en aoĂ»t.
    • Logiciels : Internet Explorer 6.
    • Sites : WikipĂ©dia.
  • 2002
    • Étendue : 36 689 008 sites en janvier, 35 991 815 en aoĂ»t.
    • Logiciels : Mozilla 1.0.
  • 2003
    • Étendue : 35 863 952 sites en fĂ©vrier, 42 807 275 en aoĂ»t.
    • Logiciels : Safari.
  • 2004
    • Le concept de Web 2.0 (dĂ©signant un phĂ©nomĂšne prĂ©-existant) apparaĂźt.
    • Étendue : 46 067 743 sites en janvier, 53 341 867 en aoĂ»t.
    • Standards : crĂ©ation du WHATwg.
    • Logiciels : Mozilla Firefox 1.0.
  • 2005
    • Étendue : 59 100 880 sites en fĂ©vrier, 70 392 567 en aoĂ»t
    • Logiciels : Mozilla Firefox 1.5.
  • 2006
    • Étendue : 76 184 000 sites en fĂ©vrier, 92 615 362 en aoĂ»t[rĂ©f. nĂ©cessaire].
    • Logiciels : Internet Explorer 7, Mozilla Firefox 2.0.
  • 2007
    • Étendue : 108 810 358 sites en fĂ©vrier[13], 127 961 479 en aoĂ»t[14].
    • Logiciels : Safari sur Windows.
  • 2008
  • 2009
  • 2010
  • 2011
    • Étendue : 284 842 077 sites en fĂ©vrier[18] 312 693 296 sites en avril[19]
    • Logiciels : Mozilla Firefox 4 (mars), 5 (fin juin), 6 (fin aoĂ»t) et 7 (fin septembre)
    • Logiciels : Internet Explorer 9
    • Logiciels : Opera 11

Évolution de l'usage

En créant le logiciel WorldWideWeb, Tim Berners-Lee a créé à la fois le premier navigateur Web et le premier éditeur Web, car il voulait faire du Web un média collaboratif, dans lequel tous les acteurs consultent et créent l'information. Cependant, le Web s'est immédiatement orienté en un média de diffusion d'information global plutÎt que de collaboration[20].

Dans la premiÚre moitié des années 1990, le concept de site web à la racine d'un nom de domaine stable n'était pas établi, à commencer par la premiÚre page Web dont l'adresse était http://nxoc01.cern.ch/hypertext/WWW/TheProject.html. Les sites étaient souvent mis en place dans des départements techniques par des employés et des étudiants, et les URL changeaient au gré des changements de personnes et d'infrastructure. En outre, il n'existait pas de moteur de recherche efficace. Aussi de nombreuses pages étaient des listes de liens sur les pages préférées de l'auteur de la page. Cette propriété du Web sera d'ailleurs exploitée plus tard par les créateurs de Google pour calculer la pertinence des pages, puis détournée par les fermes de liens. Mais bien avant cela, en janvier 1994, Yahoo! est créé et devient rapidement le plus grand annuaire Web. Comme les créateurs de Yahoo! étaient des étudiants de l'université Stanford, L'URL originale était http://akebono.stanford.edu/yahoo, et ce n'est qu'en janvier 1995 que le domaine yahoo.com est créé.

Dans la seconde moitiĂ© des annĂ©es 1990, le Web devient populaire, et toutes les grandes entreprises, organisations, Ă©coles, administrations, ouvrent un site Web. Les moteurs de recherche deviennent efficaces, notamment avec l'apparition d'Altavista[21] en dĂ©cembre 1995, et pour finir Google en 1998. Dans cette phase de dĂ©veloppement du mĂ©dia, un flot d'information top-down prĂ©domine : un site Web est fait pour diffuser les informations de son propriĂ©taire. Les interactions s'arrĂȘtent souvent Ă  la recherche et au commerce en ligne. Bien sĂ»r, le courrier Ă©lectronique, la messagerie instantanĂ©e, et les forums de discussion existaient depuis plus longtemps que le Web, mais ils fonctionnaient principalement avec des protocoles et logiciels spĂ©cifiques (voir CatĂ©gorie:Logiciel de messagerie instantanĂ©e, CatĂ©gorie:Logiciel de courrier Ă©lectronique, CatĂ©gorie:Client Usenet).

Web 2.0

Article dĂ©taillĂ© : Web 2.0.

Avec les annĂ©es 2000 les notions de blog, de wiki (WikipĂ©dia en 2001) et de rĂ©seautage social (Myspace en 2003, Facebook en 2004) deviennent populaires. Le contenu gĂ©nĂ©rĂ© par les utilisateurs se rĂ©pend (WikipĂ©dia, YouTube en 2005, Twitter en 2006). La technologie Ajax (1998) commence Ă  ĂȘtre largement utilisĂ©e pour crĂ©er des applications complĂštes qui tiennent dans une seule page Web (Google Maps en 2004). L'expression Web 2.0, largement popularisĂ©e au milieu des annĂ©es 2000, dĂ©signe cette transition dans le flux de l'information et la maniĂšre d'utiliser le Web. Le succĂšs de l'expression Web 2.0 a conduit de nombreuses personnes Ă  appeler Web 2.5, 3.0, 4.0, etc. leur vision du Web de l'avenir.

Notes et références

  1. ↑ L’image de l’araignĂ©e est parfois utilisĂ©e par les anglophones, on la retrouve ainsi dans l’expression web spider pour le robot d’indexation.
  2. ↑ a et b (en)WorldWideWeb: Proposal for a HyperText Project, T. Berners-Lee/CN, R. Cailliau/ECP, 12 novembre 1990
  3. ↑ (en)Frequently asked questions by the Press - Tim BL - Spelling of WWW
  4. ↑ Vocabulaire d’Internet - Banque de terminologie du QuĂ©bec - World Wide Web
  5. ↑ Journal officiel du 16 mars 1999 - Vocabulaire de l’informatique et de l’internet
  6. ↑ comme http://perdu.com
  7. ↑ Voir en:Scale-free_network.
  8. ↑ (en)The Deep Web: Surfacing Hidden Value, Michael K. Bergman, The Journal of Electronic Publishing, August, 2001, Volume 7, Issue 1
  9. ↑ a et b (en)Tim Berners-Lee, Information Management: A Proposal, CERN, mars 1989
  10. ↑ James Gillies, Robert Cailliau, How the Web was born: the story of the World Wide Web, Oxford, Oxford University Press, 2000, ISBN 0-19-286207-3, p. 87
  11. ↑ (en) Tim Berners-Lee, Mark Fischetti, Weaving the Web: the past, present and future of the World Wide Web by its inventor, Londres, Texere, 2000 [dĂ©tail de l’édition]  p. 27
  12. ↑ (en) Tim Berners-Lee, Mark Fischetti, Weaving the Web: the past, present and future of the World Wide Web by its inventor, Londres, Texere, 2000 [dĂ©tail de l’édition]  p. 15
  13. ↑ http://news.netcraft.com/archives/2007/02/02/february_2007_web_server_survey.html
  14. ↑ http://news.netcraft.com/archives/2007/08/06/august_2007_web_server_survey.html
  15. ↑ http://news.netcraft.com/archives/2008/02/06/february_2008_web_server_survey.html
  16. ↑ http://news.netcraft.com/archives/2008/08/29/august_2008_web_server_survey.html
  17. ↑ http://news.netcraft.com/archives/2009/02/18/february_2009_web_server_survey.html
  18. ↑ http://news.netcraft.com/archives/2011/02/15/february-2011-web-server-survey.html
  19. ↑ http://news.netcraft.com/archives/category/web-server-survey/
  20. ↑ (en) Tim Berners-Lee, Mark Fischetti, Weaving the Web: the past, present and future of the World Wide Web by its inventor, Londres, Texere, 2000 [dĂ©tail de l’édition]  p. 62
  21. ↑ Le moteur Altavista est apparu sous le domaine altavista.digital.com, et de nombreux visiteurs allaient par erreur sur altavista.com qui n'avait rien Ă  voir. Le domaine altavista.com a finalement Ă©tĂ© rachetĂ© par le propriĂ©taire du moteur de recherche pour des millions de dollars, dĂ©montrant l'importance d'un nom de domaine bien choisi dĂšs l'apparition d'un site.

Voir aussi

Articles connexes

Concepts généraux

Internet, hypertexte, hyperlien, multimédia, réseau informatique

Concepts du Web

Accessibilité du Web, Adresse Web, agence Web, agrégation Web, annuaire Web, hébergeur Web, page Web, portail Web, serveur Web, site web, Web 2.0, Web profond, Web sémantique, Surf rémunéré, Neutralité du réseau

Technologies

ActionScript, DOM, dynamic HTML, CSS, HTML, HTTP, JavaScript, SGML, standards du Web, URI, URL, XHTML, XML

Logiciels serveurs

Apache HTTP Server, moteur de recherche, NCSA HTTPd, serveur HTTP, serveur proxy

Logiciels clients

Éditeur HTML, guerre des navigateurs, liste de navigateurs Web, navigateur Web, robot d’indexation

Acteurs

America Online, IETF, Marc Andreessen, Microsoft, Netscape Communications Corporation, Robert Cailliau, Tim Berners-Lee, WHATWG, World Wide Web Consortium

Applications

Blog, gestion des connaissances, systĂšme de gestion de contenu, Webmail, wiki

Liens externes


Wikimedia Foundation. 2010.

Contenu soumis à la licence CC-BY-SA. Source : Article World Wide Web de Wikipédia en français (auteurs)

Regardez d'autres dictionnaires:

  • World-Wide Web —  Ne doit pas ĂȘtre confondu avec Internet. Le World Wide Web, littĂ©ralement la « toile (d’araignĂ©e) mondiale Â», communĂ©ment appelĂ© le Web, parfois la Toile ou le WWW, est un systĂšme hypertexte public fonctionnant sur Internet et qui 
   WikipĂ©dia en Français

  • World wide web —  Ne doit pas ĂȘtre confondu avec Internet. Le World Wide Web, littĂ©ralement la « toile (d’araignĂ©e) mondiale Â», communĂ©ment appelĂ© le Web, parfois la Toile ou le WWW, est un systĂšme hypertexte public fonctionnant sur Internet et qui 
   WikipĂ©dia en Français

  • world-wide web — n. The collective total of all computer installations that are connected to the internet and provide access to other computers connected to the internet, using {hypertext transfer protocol}, to computer files called web pages, which may have tex 
   The Collaborative International Dictionary of English

  • world wide web — n. The body of interlinked documents on websites, accessible through the Internet by using a Web browser. Synonymous with Web The Essential Law Dictionary. Sphinx Publishing, An imprint of Sourcebooks, Inc. Amy Hackney Blackwell. 2008. world wide 
   Law dictionary

  • World Wide Web — WWW redirects here. For other uses, see WWW (disambiguation). The Web redirects here. For other uses, see Web (disambiguation). Not to be confused with the Internet. World Wide Web The Web s historic logo designed by Robert Cailliau Inventor 
   Wikipedia

  • World Wide Web — Antiguo logo de WWW diseñado por Robert Cailliau. Para otros usos de este tĂ©rmino, vĂ©ase WWW (desambiguaciĂłn) y Web (desambiguaciĂłn). No debe confundirse con ExpresiĂłn errĂłnea: operador tan inesperado o 
   Wikipedia Español

  • World Wide Web — Das historische WWW Logo, entworfen von Robert Cailliau 
   Deutsch Wikipedia

  • World Wide Web — Đ’ŃĐ”ĐŒĐžŃ€ĐœĐ°Ń ĐżĐ°ŃƒŃ‚ĐžĐœĐ° (Đ°ĐœĐłĐ». World Wide Web) Ń€Đ°ŃĐżŃ€Đ”ĐŽĐ”Đ»Đ”ĐœĐœĐ°Ń ŃĐžŃŃ‚Đ”ĐŒĐ°, ĐżŃ€Đ”ĐŽĐŸŃŃ‚Đ°ĐČĐ»ŃŃŽŃ‰Đ°Ń ĐŽĐŸŃŃ‚ŃƒĐż Đș сĐČŃĐ·Đ°ĐœĐœŃ‹ĐŒ ĐŒĐ”Đ¶ĐŽŃƒ ŃĐŸĐ±ĐŸĐč ĐŽĐŸĐșŃƒĐŒĐ”ĐœŃ‚Đ°ĐŒ, Ń€Đ°ŃĐżĐŸĐ»ĐŸĐ¶Đ”ĐœĐœŃ‹ĐŒ ĐœĐ° Ń€Đ°Đ·Đ»ĐžŃ‡ĐœŃ‹Ń… ĐșĐŸĐŒĐżŃŒŃŽŃ‚Đ”Ń€Đ°Ń…, ĐżĐŸĐŽĐșĐ»ŃŽŃ‡Đ”ĐœĐœŃ‹Ń… Đș Đ˜ĐœŃ‚Đ”Ń€ĐœĐ”Ń‚Ńƒ. Đ’ŃĐ”ĐŒĐžŃ€ĐœŃƒŃŽ ĐżĐ°ŃƒŃ‚ĐžĐœŃƒ ĐŸĐ±Ń€Đ°Đ·ŃƒŃŽŃ‚ ĐŒĐžĐ»Đ»ĐžĐŸĐœŃ‹ web сДрĐČĐ”Ń€ĐŸĐČ.… 
   ВоĐșĐžĐżĐ”ĐŽĐžŃ

  • World Wide Web — a system of extensively interlinked hypertext documents: a branch of the Internet. Abbr.: WWW [1990 95] * * * â–Ș information network byname  The Web        the leading information retrieval service of the Internet (q.v.; the worldwide computer… 
   Universalium

  • World Wide Web — noun a) Collectively, all of the web pages on the Internet which hyperlink to each other and to other kinds of documents and media. WorldWideWeb: Proposal for a HyperText Project [title] b) Internet resources that are retrieved by Hypertext… 
   Wiktionary


Share the article and excerpts

Direct link

 Do a right-click on the link above
and select “Copy Link”

We are using cookies for the best presentation of our site. Continuing to use this site, you agree with this.