PageRank

3.3652597402488 (616)
Posté par woody 23/03/2009 @ 03:07

Tags : pagerank, seo, internet, high-tech

Dernières actualités
Matt Cutts enterre le Pagerank sculpting - iniseO
Si il ya bien une technique de référencement qui est loin de faire l'unanimité dans le sérail du SEO c'est sans nul doute la sculpture du PageRank qui vise à augmenter artificiellement le poids de pages au détriment d'autres....
10 outils gratuits au service du référencement - Les Infostratèges
Suivi des backlinks et du PageRank, comparaison de mots clés ou d'expressions, indices de visibilité... Le Journal du Net propose un mini-guide composé d'outils permettant de suivre sa visibilité dans les moteurs de recherche ou de mieux connaître les...
Matt Cutts : le duplicate content n'est plus un problème - Blog Webmarketing & Référencement / SEO
Afin de ne pas donner une image incomplète, il convient de noter (comme Cutts l'a fait) que Google reste axé sur l'expérience positive des utilisateurs, et il serait mieux que dans le cas de figure d'un réseau de 200 sites, le PageRank soit diffusé...
La régie des blogueurs bloglebuzz - News et Divertissements
Pour devenir membre de bloglebuzz.com, il vous suffit de vous inscrire sur notre page d'accueil. en fonction du budget de nos annonceurs, du pagerank de votre blog et la qualité de son contenu. rapidement de l'information sur votre activité internet...
Chacun cherche son "Search" - E24
D'où l'évolution tentée par Bing qui veut améliorer le principe de Google -qui classe les liens en fonction de leur popularité sur l'internet (le système PageRank)- en proposant des informations structurées présentées de façon claire et immédiatement...
Lien idéal pour améliorer votre référencement - Webmarketing & co'm
Les sites au PageRank élevé sont généralement considérés comme 'autorité' dans leur domaine. Un lien provenant d'un site jouissant d'une haute reconnaissance (trust) vous apportera plus de valeur aux yeux des moteurs qui vous classeront mieux dans...
Glossaire des termes les plus utilisés d'Internet - TWC Média (Communiqué de presse)
Voir aussi Pagerank et Trustrank. Technique marketing basée sur le bouche-à-oreille, ne privilégiant pas nécessairement Internet, mais plutôt toute sorte de moyen novateur. Voir aussi Marketing viral. Données stockées sur un serveur pour permettre leur...
Google fait son show à Londres - Le Figaro
Depuis l'invention de l'algorithme Pagerank, à l'origine de Google, par Sergey Brin et Larry Page dans les années 1990, la vitesse d'obtention des résultats a toujours été une priorité pour l'entreprise californienne. «Larry a toujours un chronomètre...
Google est-il trop gros ? - StreetReporters
Sa force réside dans son algorithme plus efficace que ceux des autres moteurs de recherche grâce au pagerank (système de classement des pages web) qui permet une plus grande pertinence des réponses aux requêtes. Google, c'est aussi et surtout une...
Booster le trafic de votre site grâce à la diffusion d'articles - Come4News
De plus, si votre article est repris par d'autres webmasters, votre popularité (pagerank) augmentera et générera des nouveaux lecteurs ciblés et qualifiés. Le lien dans votre article quant à lui permet d'obtenir un lien supplémentaire qui pointe vers...

PageRank

Illustration du PageRank.

Le PageRank ou PR est le système de classement des pages Web utilisé par le moteur de recherche Google pour déterminer l'ordre et la pertinence des liens dans les résultats de recherche qu'il fournit. De nos jours le PageRank n'est qu'un indice parmi tant d'autres dans l'algorithme qui permet de classer les pages internet dans les résultats de recherche de Google. Ce système a été inventé par Larry Page, cofondateur de Google. Ce mot est une marque déposée.

Google affecte un score à chaque page Web. Cette note est attribuée en fonction de nombreux critères et principalement en fonction des liens externes (popularité de liens) pointant vers la page web, ainsi que des liens que cette dernière fait vers elle-même (liens internes).

L'algorithme du PageRank basé sur les liens était à l'origine le moyen utilisé par Google pour donner une note aux pages. Mais, comme cela est décrit dans le brevet déposé le 17 avril 2007, de nombreux autres critères sont maintenant pris en compte. Aussi, la valeur du PageRank n'offre désormais qu'une indication peu significative sur son importance.

Le PageRank réel d'une page n'est connu que de Google, même si l'on peut penser qu'il suit les principes du brevet. Les internautes peuvent obtenir une approximation du classement de la page en consultant la zone PageRank de la Google Toolbar, qui indique sa valeur sur une échelle de 0 à 10 (Échelle logarithmique). Il existe aussi de nombreux outils pour l'obtenir sans afficher la toolbar.

Le premier brevet (intitulé Method for Node Ranking in a Linked Database), déposé en janvier 1997 et enregistré le 9 janvier 1998, est la propriété de l'Université Stanford, qui a octroyé la licence de cette technologie à Google en 1998 (amendée en 2000 et 2003), deux mois après sa fondation. Il s'agit d'une licence exclusive jusqu'en 2011, l'exclusivité prenant fin à cette date.

Les recherches qui ont abouti au développement de la technologie du PageRank ont été financées en partie par la National Science Foundation. Il est donc précisé dans le brevet que le gouvernement a certains droits sur cette invention.

Les référenceurs et les webmestres créent quelquefois massivement des liens retour, par échanges de liens ou en inscrivant un site sur une quantité d'annuaires. Google avait autrefois une vision quantitative de la popularité d'une page, cette technique permettait donc de gonfler artificiellement son indice de popularité. Mais Google a réagi : d'une part en instaurant des filtres, tels que la Sandbox. Il détecte et sanctionne les campagnes massives de liens artificiels ; par ailleurs il intègre des critères qualitatifs à l'analyse des liens (sémantique, confiance : indice TrustRank, comportement des utilisateurs).

C'est un critère d'autorité accordé aux pages, du fait que l'auteur dispose d'une qualité de sérieux et de compétence reconnue. Ce critère est associé aux sites gouvernementaux, et aux sites de référence tels le W3C.

La valeur nofollow de l'attribut HTML rel a été définie par Google en 2005, hors des processus normatifs du W3C. Selon Google, un lien ainsi qualifié dans une page Web n'entre pas en compte dans l'algorithme de calcul de pageRank .

Beaucoup d'outils proposent de calculer le futur classement d'une page après le prochain passage du googlebot. Ces outils ne sont pas fiables car ils se basent uniquement sur la valeur RK du checksum de Google. L'utilité de cette donnée n'est connue que de Google et n'a rien à voir avec un futur Page Rank.

Le Page Rank est mis à jour environ 4 fois dans l'année.

L'algorithme du PageRank a fait l'objet d'un sujet de Maths au concours BCE 2008 (voie ECE - ESSEC Epreuve 2).

En haut



Lien retour

Le smiley jaune représente le site internet ayant le plus grand nombre de backlinks.

Les liens retour (de l'anglais backlinks) sont les liens pointant vers un site ou une page web. Leur nombre est une indication de la popularité ou de l'importance de ce site ou de cette page. Basiquement, un backlink est n'importe quel lien reçu par un nœud du web (page web, annuaire, site Internet, ou Domaine de premier niveau) depuis un autre nœud du Web. On dit aussi liens entrants, liens arrivants (inbound links), et inlinks.

Les moteurs de recherche utilisent souvent le nombre de backlinks d'un site Internet comme l'un des facteurs pour déterminer le classement de ce site Internet. Par exemple, l'algorithme PageRank de Google utilise les backlinks pour l'aider à déterminer le positionnement d'un site. (la barre d'outils de Google peut être utilisée pour voir le PageRank d'une page web, ainsi que des extensions comme indiqué ci-dessous). Pour cette raison, les webmasters emploient souvent des techniques variées (appelées Optimisation pour les moteurs de recherche ou SEO pour accroître le nombre de backlinks pointant vers leur site internet.

Certains sites spécialisés fournissent des informations sur les backlinks.

Des extensions et plugins pour navigateur internet sont développés pour faciliter ces recherches. Exemples : SEOpen, SeoQuake (extensions pour Mozilla Firefox). Il existe aussi des outils anglophones et francophones, gratuits et payants, permettant d'obtenir des backlinks de grande qualité et améliorer le trafic et le PageRank de son site internet.

En haut



Barre d'outils Google

La barre d’outils de Google (Google Toolbar), créée par Google, est un objet optionnel pour deux des navigateurs Web principaux : c’est soit une extension pour Mozilla Firefox, soit un plugin pour Internet Explorer. Elle contient un champ de remplissage qui permet de lancer une recherche sur Internet, soit en recherche classique soit en recherche dans les images, les actualités… Elle peut bloquer les fenêtres intruses, afficher le PageRank de la page, vérifier l’orthographe et aussi traduire automatiquement dans la fenêtre d’aide du pointeur les mots survolés de l’anglais vers une autre langue.

Dans un premier temps, cette extension n’est disponible que pour Internet Explorer. Des développeurs indépendants, sans affiliation à Google, lancent le projet Open Source « Googlebar », destiné à être l’équivalent pour Mozilla Firefox de la barre d’outils de Google. Le 8 juillet 2005, Google lance une version officielle de la barre d’outils pour le navigateur Mozilla Firefox.

La barre d’outils communique à Google les URL visitées, ce qui permet d'indexer aussi des pages soit-disant masquées : celles rendues plus confidentielles par leur créateur en ne les référençant nulle part. Cette technique courante de dissimulation est ainsi mise en échec à l'avantage des chercheurs sur Google qui ont des résultats plus exhaustifs. Cette fonctionnalité est parfois décriée car elle perçue comme un outil mouchard.

En haut



Critique de Google

Cet article regroupe l'ensemble des critiques et controverses autour de la société spécialisée dans la recherche Internet, Google.

Un certain nombre d'association, se basant sur le Digital Millennium Copyright Act, ont exigé que Google retire des copies de parties de texte présentes sur d'autres sites, notamment à partir de site d'actualité. Conformément à ce qui fut demandé, Google inclut un lien vers le site des parties plaignantes.

Des plaintes ont été déposées contre Google à cause d'une possible violation de droit d'auteur par l'une de ses fonctionnalités : Google Web Cache. Cependant, Google utilise un mécanisme de gestion des requêtes au sein duquel la mise en cache est désactivée. De plus, Google propose un autre mécanisme, le fichier robot.txt, qui permet aux webmestres d'effectuer une demande explicite pour qu'une partie ou la totalité de leur site ne soit pas incluse dans le système de recherche Google.

La cour du District du Nevada (US) jugea dans l'affaire Field v. Google et Parker v. Google., que le système de mise en cache de Google ne constituait pas une violation du droit d'auteur telle que décrite dans la loi américaine sur le droit d'auteur.

En juin 2004, Google Watch révéla les détails du contrat entre l'Université du Michigan et Google concernant la création de copies numériques de différents ouvrages sous droit d'auteur de la bibliothèque de l'université. Ce contrat s'intègre dans la politique de l'outil Google Book Search de numériser des millions de livres et de créer un outil de recherche par texte.

Certains dénoncent une violation du droit d'auteur à cause de l'utilisation commerciale d'ouvrages sous droit d'auteur en intégrant des annonces publicitaires à côté des résultats de recherche sur les textes numérisés. Cependant, Google a créé un précédent en publiant des copies numérisés d'ouvrages sous droit d'auteur et ce à grande échelle et sans permission explicite des propriétaires des ouvrages. Entretemps, Google clame que ceci est en accord avec toutes les lois et jurisprudences sur les droit d'auteur existants pour les livres.

Selon le contrat signé entre Google et l'Université du Michigan, Google fournira seulement des extraits des textes sous droit d'auteur dans ses recherches. Le contrat est conforme au Fair use, une exception dans la loi américaine sur le droit d'auteur qui permet de reproduire des parties d'ouvrage sous droit d'auteur pour des objectifs de recherche.

Daniel Brandt, un critique tenace spécialisé dans les affaires de Google, découvrit en 2002 que Google créait un cookie sur chaque ordinateur, qu'il peut être utilisé pour suivre l'historique des recherches de l'utilisateur, et découvrit que ce cookie n'expirait qu'en 2038.

À partir de 2007, les cookies de Google expirent au bout de deux ans mais réinitialise ce compteur à chaque fois que l'on utilise le site de Google. While there is no evidence that Google turns over information to the FBI or the NSA, the value of what Google gathers about users every time they perform a search, Brandt holds, is simply too alluring to keep away from the government's eyes.

En réponse à ceci, Google déclara que les cookies étaient nécessaire pour conserver les préférences des utilisateurs entre deux utilisations et offrir d'autres fonctionnalités, un tel délai d'expiration étant quelque chose d'assez commun.

Les critiques soulignèrent les dangers et les conséquences concernant la protection de la vie privé de l'utilisation d'un système centralisant les données sur les recherches de millions de personnes utilisant un outil populaire, et comment par le biais de la loi américaine relative au copyright, Google pourrait être forcé de remettre toutes ces informations aux gouvernement américain ou à n'importe quel autre gouvernement de pays à partir duquel le site Google est accessible.

Certaines personnes croient que le service de messagerie de Google nommé Gmail va plus loin que le simple envoi de courriel. Le constat est souvent effectué que les internautes sans compte Gmail, qui n'ont donc pas accepté les termes du contrat Gmail, mais qui envoient des courriels aux utilisateurs de Gmail voient leurs correspondances analysées sans permission. En retour à ces accusations, Google déclare que les courriels reçus ou envoyés par Gmail ne sont jamais lus par des personnes à l'exception du propriétaire du compte de messagerie et que le système informatique ne parcourt le courriel que pour améliorer la pertinence des publicités présentes sur la page de messagerie des utilisateurs. D'autres services de messagerie populaire comme Hotmail parcourent aussi les courriels entrant pour tenter de déterminer si c'est un pourriel (ce que fait aussi Gmail), à la différence qu'ils ne le font pas pour améliorer la pertinence des publicités.

Début 2005, le département de Justice des États-Unis déposa un recours devant la court fédérale pour forcer Google à se conformer à une assignation l'obligeant à ne retenir que « les mots saisis pour lancer une recherche sur le système de recherche de Google et ce, pour une durée d'une semaine (en excluant toutes informations permettant d'identifier la personne qui a saisi ces mots) ».

Google s'opposa fermement à cet assignement en raison des préoccupations au sujet des informations confidentielles des utilisateurs .

En mars 2006, la cour de justice statua partiellement en faveur de Google, reconnaissant l'implication en termes de respect de la vie privé du stockage des mots de recherche.

Dans un rapport de 2007, Privacy International classa Google comme « hostile à la protection de la vie privé », qui est le plus bas niveau dans le classement de ce rapport, faisant ainsi de Google la seule société de cette liste à atteindre ce niveau.

Au sein de l'Union européenne, la commission en charge de la protection des données a écrit à Google lui demandant de justifier sa politique de conservation les données des recherches sur Internet à partir de son site et ce, pour une durée supérieure à deux ans. Ce courrier demande si Google a "rempli tout les pré-requis" des lois européennes relatives à la protection des données . L'investigation de l'Union européenne est toujours en cours (au 24 mai 2007). Le 01 juin, Google admit que ses règles concernant la protection des données personnelles étaient vagues..

L'inspection norvégiennes -data- (la Norvège n'est pas un État membre de l'Union européenne) s'est penché sur les pratiques de Google (et d'autres) et a statuée que la période de 18 à 24 mois de rétention d'informations proposée par Google était trop longue.

PageRank, le principal système de Google, a été très critiqué. Certains, comme Daniel Brandt le considère comme « antidémocratique ». Les principaux arguments sont que le système est injustement biaisé en faveur des grands sites Internet, et que les critères pour définir l'importance d'une page ne sont pas revus par aucun organisme externe. PageRank est un vaste système automatisé qui est impartial dans la mesure où il ne connaît pas de parti pris. Cependant, le système de Google compte quand même sur un certain degré d'intervention humaine (par exemple l'évaluation humaine de PageRank, connu sous le nom de Rater Hub Google), et l'utilisation de noms de sociétés dans Adwords . En outre, la suppression de certains sites critiques (par exemple, le site critique sur la Scientologie) est l'initiative d'êtres humains en accord avec les règles de la société. Il reste cependant difficile à dire si un autre système pourrait définir l'importance d'une page d'une manière à générer moins de critiques que le système pageRank.

Le système est aussi susceptible de manipulation et de fraude à travers l'utilisation de dummy sites, tel que l'utilisation de bombardement Google ou de spamdexing.

En septembre 2007, la Commission australienne sur la concurrence et le consommateur (ACCC] a lancé une double procédure contre Trading Post et Google, incluant les succursales Google Australia et Google Ireland, pour fausse publicité (litt. Tromperie envers le client) en vendant ces classements à des sociétés plutôt que de les classer par pertinence.

Annoncés le 6 janvier 2006 au CES à Las Vegas (Nevada), les magasins Google Video vendent des contenus propriétaires aux sites Google Video. Initialement, ce service était réservé aux États-Unis et à certains autres pays. Pour protéger le droit d'auteur de certains programmes vidéos, Google créa le DRM Google (Digital Rights Management) protection pour certains contenus payants, qui a causé des inquiétudes en ce qui concerne le respect de la vie privé des utilisateurs..

Le 15 août 2007, Google interrompu son programme de DTO/DTR (Téléchargement, location). Les vidéos qui avaient été précédemment achetés par le biais de ce programme, parce que le système DRM intégré dans les vidéos fut révoqué, ne sont plus visionnables malgré le fait qu'elles furent achetées légalement et pour un usage privé.

En mars 2005, l'Agence France-Presse (AFP) poursuivit Google pour 17,5 millions de dollars, alléguant que Google News violait ces droits d'auteurs parce que « Google inclut des photographies, des histoires et des titres d'articles de presse de l'AFP sur son site Google News sans permission de l'Agence France-Presse ».."Il fut aussi reproché à Google d'ignorer les injonctions de l'AFP à ce sujet, quoique Google rétorqua à ceci qu'il avait engagé avec l'AFP des démarches en ce sens mais que l'AFP n'avait jamais répondu.

On dit aussi que l'AFP a cherché à empêcher une libre utilisation de ces articles, il aurait été alors demandé à ces diffuseurs de mettre en place un système de souscription plutot que de poursuivre Google. De plus, "en 2002, une court d'appel fédérale jugea que les sites Internet pouvaient reproduire et recopier les petites images, ou encore réduire des version éditoriales de photographies sous copyright", de tel manière que Google News, surtout l'accusation de reproduction d'image, ne seraient plus en infraction. Pourtant, AFP retorqua que le titre et les premières des articles de presse étaient le "coeur" du travail fournit et qu'en conséquent, leur reproduction constituait un infraction aux lois sur les droits d'auteur.

Selon Canda Free Press, "Google Inc. est maintenant sur le point de retirer l'ensemble des contenus de l'Agence France-Presse de ces serveurs, bien que le porte-parole de l'AFP confirma que les poursuites continuèraient dans l'hypothèse où Google supprimerait les contenus illicites. Il semble que l'objectif de poursuivre Google soit seulement basé sur la volonté de reconnaître la loi sur les droits d'auteur, plus qu'une volonté d'empêcher Google de reproduire ses contenus.". L'article conclut : "Ceci pourrait être un triste jour pour ceux qui utilisent Internet pour se documenter sur l'actualité si l'AFP sort glorieux de ce combat avec Google. Les poursuites judiciaires de l'AFP, si elles arrivent positivement au bout de la procédure, auront un fort impact sur les nouvelles mises à disposition sur Internet.".

Le 6 avril 2007, l'AFP et Google ont trouvé un accord . Ce accord mis fin à toutes les poursuites en court. Il permet notamment à Google d'utiliser l'ensemble des articles de l'AFP. C'est une grande différence avec les pratiques jusqu'alors faites.

Le 21 février 2006, dans le cadre d'une procédure judiciaire à l'encontre du site en ligne pour adultes Perfect 10, un juge de district a jugé que la fonction de recherche d'image de Google avait violé la loi sur la copie, sans permission, de photographie de femmes nues créées par Perfect 10.

Le 20 septembre 2005, la Guilde des Auteurs, un groupe qui représentent 8 000 auteurs américain, menèrent une action collectives en justice auprès de la cour fédérale de Manhattan contre Google à cause de ces reproductions non-autorisées et ces copies de livres à travers son programme de bibliothèque Google. La Guilde des Auteurs réclame des dommages et intérêts et une injonction pour empêcher Google à l'avenir de continuer son très ambitieux projet de numérisation. L'issu du procès dépendra de l'interprétation d'une partie de la loi sur les droits d'auteur.

Beaucoup de commentateurs à travers le monde des droits d'auteur et du numérique ne sont pas surpris par le déroulement de cette affaire. D'un aveux à demi caché au sujet de ce projet, Google a annoncé ces projets en août 2005 de respecter les souhaits de chacun des titulaires d'oeuvres qui contacteraient la société pour les informer qu'ils ne souhaitaient pas voir leurs oeuvres réutilisées ou numérisées .

Google a été largement critiqué à cause de la censure qu'il imposait sur ces contenus et sur ces services, notamment en Chine.

En haut



Google (moteur de recherche)

Logo de Google

Le moteur de recherche Google, qui a donné le nom à la société Google, est le moteur de recherche sur Internet le plus utilisé au monde par les internautes.

Le principe de fonctionnement de Google, qui a fait son succès, est fondé sur une invention de ses créateurs, le PageRank : lorsqu'un document est pointé par de nombreux hyperliens (popularité de liens), son PageRank augmente. Plus son PageRank est élevé, plus il aura de chance d'être affiché dans les premiers résultats d'une recherche. Ce système donne une indication de la popularité du document parmi les autres documents du web.

Ce principe a immédiatement été un succès, car il a permis des résultats plus pertinents que les autres moteurs de recherche qui se contentaient de comptabiliser les mots-clés insérés dans les pages des sites. Il a également permis ce que l'on appelle le bombardement Google.

En outre, ce moteur de recherche est aussi apprécié pour sa rapidité de recherche et sa sobriété : pas de Flash, pas de bandeau publicitaire clignotant, etc. Son interface a inspiré celle d'autres moteurs, comme Yahoo!.

Cette sobriété, loin d'être anecdotique, est au moins en partie à l'origine du succès du site. À l'époque de son lancement en effet, la mode était aux moteurs de recherche insérés sur des pages très chargées en contenu et en publicité. Ces pages étaient souvent longues à s'afficher et difficiles à lire.

Il utilise tout de même un système d'AdWords (« publicité de mots ») pour se rémunérer. Ce système est fondé sur une valeur par mot selon sa demande. Plus le mot sera demandé, plus il sera payé cher par clic. Mais il est toujours possible pour l'utilisateur de bloquer l'affichage de ces publicités grâce à des plugins tels que CustomizeGoogle pour Firefox.

Vers 2002, Google affirmait distribuer la charge sur plus de 10 000 PC fonctionnant avec un noyau Linux modifié. Le chiffre de 1 000 requêtes simultanées en pointe a aussi été souvent évoqué. Les chiffres réels semblent 10 fois plus élevés. Ils sont cependant secrets, notamment pour ne pas permettre de calculer facilement l'investissement nécessaire pour concurrencer Google.

Google utilise des robots nommés Googlebot qui visitent à intervalle régulier l'ensemble des sites web ayant demandé à être référencés afin de maintenir à jour la base de données qui fournit les réponses aux requêtes des internautes.

Hormis le logo officiel , le site adopte des logos particuliers pour certaines fêtes et évènements : les Google Doodles. Réalisés par Dennis Hwang, un designer américain d'origine coréenne de 23 ans, ils apparaissent régulièrement dès qu'une fête locale ou internationale (nouvelle année, fêtes nationales, etc.) ou un évènement marquant (Jeux Olympiques, commémoration d'une personne illustre, etc.) le permet.

Tous les logos de fêtes et d'évènements de www.google.com mis en ligne depuis 1999 sont disponibles ici et, plus spécifiquement, ceux qui sont apparus en France sont disponibles là.

Une version bêta est habituellement une mention signifiant qu'un programme est en phase de finition. Chez Google c'est devenu une marque de fabrique apposée sur la plupart des services et logiciels à l'exception du moteur de recherche et des services publicitaires.

L'intérêt qui réside dans l'appellation « version bêta » est que, du point de vue de la qualité du service, elle n'engage à aucune obligation de résultat, étant donné que c'est une phase de développement. Cela peut également signifier que les services Google sont en perpétuelle phase d'amélioration.

Cette particularité propre à Google devient une mode qui se traduit chez ses concurrents par un usage plus ostensible de cette mention.

Ce moteur de recherche est disponible en 35 langues et propose son interface en plus de 100 langues.

Google est à la base un moteur de recherche de pages web, il s'est étendu progressivement à divers types de documents (PDF, Microsoft Word, Flash, ...), aux images. Ainsi qu'aux forums Usenet, par Google Groups depuis le rachat de Deja News. Le web2news donne accès aux forums consacrés à Google.

Il possède maintenant une section répertoire qui permet de trouver des sites par catégorie (répertoire dmoz classé par PageRank), et un portail d'actualités regroupant les sites des journaux à grand tirage et des plus grandes agences de presse.

La grande popularité de Google et sa politique de développement très diversifiée (liens publicitaires, achats de bases de données et d'archives de forums) a fini par entraîner un certain nombre de craintes quant à la dérive potentielle de cette puissance : en effet, il suffit parfois de «googler» le nom d'une personne pour obtenir sur elle des informations personnelles et approfondies.

Google propose ainsi un nombre croissant de fonctions annexes, disponibles soit par le champ Google normal, soit sous forme d'application web.

Google propose un formulaire simple et un formulaire de recherche avancée permettant d'exclure des mots ou de rechercher des expressions complètes (voir ici d'autres fonctions avancées).

La documentation de Google sur son interprétation des requêtes est assez spartiate. L’évolution du fonctionnement observé montre que ceci est sans doute à dessein pour garder une liberté de changement maximale. Ce qui suit doit être continuellement validé et remanié pour suivre les modifications.

Le GoogleGuide vous donne d’autres exemples. Le site de HotBot États-Unis fournit un formulaire de recherche Google parfois plus pratique que celui de Google même.

Il est essentiel de faire ses recherches en changeant sa langue d’utilisateur en fonction de la langue des mots cherchés. Google trie alors les documents en favorisant cette langue (et utilisera peut-être un jour le bon dictionnaire de synonymes). Il utilise alors l’algorithme adéquat pour rendre équivalents le singulier et le pluriel, le féminin et le masculin (rappel: le néerlandais semble mal supporté pour l’instant).

Depuis le 21 novembre 2008, la fonctionalité SearchWiki permet de personaliser la page de résultats google (le service n’est accessible (pour le moment ?) que depuis la version en anglais de Google (google.com, et pas depuis google.fr).

Google gère les accents écrits sous forme d'entités, mais pas les caractères Unicode. Par conséquent, rechercher « alcene » et « alcène » ne donne pas le même résultat (car un mot seul est cherché en donnant une préférence à la forme dans laquelle il a été écrit) tandis que rechercher « encyclopédie » ou « ENCYCLOPÉDIE » ne change rien.

Si vous tapez « recette de la soupe au * et à la tomate », Google vous proposera le basilic ou le potiron à la place de l'étoile. On peut élargir ses recherches aux synonymes d'un mot, en le précédant du symbole « ~ ». Le « + » permet de forcer le mot à être interprété tel quel par Google (ceci est notamment utile pour les accents en français).

Les nombreuses fonctionnalités de Google ont donné naissance à différentes utilisations ludiques par les internautes.

De nombreux concours de positionnement ont vu le jour sur Google, puis sur d'autres moteurs. Le but est de placer une page sur un mot-clé plus ou moins fictif en première position des résultats de recherche sur celui-ci. Le premier concours important concernait la requête SERPS. En 2004, un concours francophone sur l'expression mangeur de cigogne a rassemblé 170 candidats et atteint 420 000 requêtes sur Google pour cette expression. Des controverses ont eu lieu sur les motivations de ces concours, qui sont pour les uns des outils d'expérience utiles au référencement, mais qui n'ont selon les autres que des motivations uniquement ludiques, faisant de Google un simple terrain de jeu.

Le bombardement Google (Google bombing) consiste à associer sur le plus de pages web possible une expression à un site web donné, de sorte qu'une recherche Google sur cette expression remonte le site en question dans les premiers résultats. Les campagnes de bombardement Google se font à travers les forums ou les blogs, en incitant les internautes à participer. Il suffit au participant d'ajouter sur un site web ou un blog un lien vers le site visé en l'associant à l'expression.

L'un des premiers sites à avoir été visé par un bombardement est celui de la biographie du président des États-Unis George Walker Bush sur le site de la Maison Blanche. Une recherche google sur l'expression « failure » ou « miserable failure » donne encore ce site comme premier résultat ().

Au cours de l'automne 2005, et faisant suite à une campagne massive de courriels lancée par le parti politique de Nicolas Sarkozy, et en représailles, les Webmestres ont appelé à faire du Google Bombing sur le nom du ministre de l'Intérieur. Ainsi, quand vous tapiez Nicolas Sarkozy dans Google, vous obteniez en deuxième position un lien pointant vers Iznogoud, le personnage de bande dessinée qui veut être calife à la place du calife. Le Google Bombing consiste à mettre sur la page d'un site web un lien (Iznogoud ou George Bush) et de l'associer à un texte (Nicolas Sarkozy ou miserable failure). Si l'opération est effectuée par un nombre certain de webmasters, le résultat est rapide : les liens fallacieux remontent dans les premiers résultats de Google.

Fin janvier 2007 Google annonce avoir mis au point un algorithme permettant de résoudre le problème du "google bombing" et ce dans n'importe quelle langue. Désormais "miserable failure" renvoi sur une page expliquant le "google bombing".

Le Google Fight consiste à comparer le nombre de résultats renvoyé par Google sur plusieurs expressions : est déclarée vainqueur l'expression ayant obtenu le plus de résultat. Les internautes s'amusent ainsi à comparer des noms, des idées politiques, etc. Un site web a même été créé pour offrir une interface à ce type de "combat" .

Depuis janvier 2006, l'équipe de Google intercepte les requêtes de Google Fight et renvoie des résultats fantaisistes. Vous pouvez le vérifier en interrogeant le site plusieurs fois de suite sur le même couple de noms.

Le Google Whacks est un jeu qui consiste à trouver deux mots qui associés dans une recherche sur Google donnent un unique résultat. Les termes employés doivent exister dans le dictionnaire, et le site trouvé ne doit pas être une simple liste de mots. Les guillemets et tous signes de ponctuation ne doivent pas être utilisés. Le score est souvent calculé en multipliant le nombre de résultats du premier terme par le nombre de résultats du second mot.

Il existe des moteurs de recherche qui sont des copies de Google dans une langue minoritaire et non officielle. La plupart du temps, ils sont créés dans un but humoristique.

La principale limite de Google est que le moteur ne parcourt que le web visible, laissant de côté toutes les bases de données professionnelles, parfois énormes, et souvent pertinentes, mais dont l’accès est limité (mais parfois gratuit). Exemple : Dialog (15 000 Go).

Plusieurs études parues sur le web montrent des limites internes sérieuses de Google, comme un article de bases-publications (consultation gratuite).

Plusieurs recherches ont montré que le nombre de pages réellement indexées ne serait que la moitié du nombre annoncé ; l’autre moitié serait des pages visitées par le robot de Google, mais dont seule une partie (l’en-tête, sans le corps de la page) serait indexée. Ces pages seraient essentiellement des pages non-anglophones, à cause de la technologie Adword, qui est utilisable seulement pour l’anglais, et qui est la principale source de financement de Google.

Cette notion de taille de l'index a été et reste un élément marketing majeur des moteurs de recherche. Fin 2005, suite à une analyse critique, démarrée en janvier 2005, de la taille de son index, initiée par Jean Véronis, la firme Google a décidé de ne plus mettre cet argument en avant. A titre d'exemple sur cette approche marketing, Google avait annoncé un doublement de la taille de son index annoncé, le lendemain du lancement de MSN Search.

Lors d’une recherche d’une complexité moyenne (utilisation d’un opérateur booléen, c'est-à-dire d’un espace ), les résultats varient du simple au triple dans la même journée ; dans certains cas, selon un ordre de grandeur allant de un à dix.

Quelquefois, le moteur de recherche ne tient pas compte des opérateurs demandés.

Cette variabilité dans le nombre de réponses apportées s’explique par l’architecture de Google. Il existe en effet plusieurs serveurs dispersés dans le monde, hébergeant l’index des pages visitées par Google. Selon l’endroit où se trouve un internaute (ou selon le site local de Google interrogé), sa requête est dirigée vers l’un ou l’autre de ces serveurs. Normalement, chaque index est identique aux autres ; mais comme ils ne sont pas synchronisés en temps réel (mais à des intervalles pouvant dépasser le mois), seul l’index principal, situé en Californie, est constamment à jour, et donne un maximum de réponses correctes. Le serveur principal peut donner ainsi dix fois plus de réponses qu’un serveur secondaire.

D'après Jean Véronis (« Etude comparative de six moteurs de recherche », février 2006), Yahoo! et Google sont les deux meilleurs moteurs (parmi six des principaux moteurs francophones). Pour l'auteur, ces deux moteurs ayant des performances équivalentes, la raison de la préférence massive des internautes pour Google n'est pas la pertinence des résultats.

Mais, selon Trent, il pourrait être inférieur à Windows Live Search .

En devenant le premier moteur de recherche en termes d'utilisation, Google est devenu le premier véhicule d'information sur Internet. Ce rôle - véhiculer l'information - est inhérent au métier des moteurs de recherche et les problèmes qui en découlent ne sont donc pas tous imputables à Google, qui n'est pas l'auteur du contenu des pages.

Au-delà des difficultés posées par l'importance stratégique du classement de Google dans le domaine économique, le véritable problème réside dans la forte influence idéologique que possèdent les pages qui apparaissent dans les premiers résultats et qui font figure de parole d'évangile. La popularité d'un moteur de recherche tel que Google peut être utilisé comme vecteur de désinformation, où l'influence d'un site est d'autant plus importante que le mot clé est populaire et qu'il se trouve en tête de liste. Les dirigeants de Google avouent être impuissants face aux phénomènes d'intoxication et de diffamation qui s'affichent actuellement dans les premiers résultats de Google, la technique ne pouvant juger la sincérité de l'information.

Les dirigeants de Chine populaire gênés qu'une recherche sur Tiananmen dans Google Images renvoie des photos de chars réprimant la révolte étudiante, ont obtenu de Google que la requête "Tiananmen" sur le portail chinois de Google ne renvoie plus ces images.

Toutefois, si l'on écrit le même mot avec une graphie approximative (Tienanmen par exemple), le moteur de Google renvoit bien les photos de chars.

Suite à des tentatives de BMW Allemagne et de son référenceur, d'augmentation de son PageRank (et donc du positionnement des liens vers BMW sur des requêtes comme voiture dans Google), la firme automobile a été blacklistée par Google qui l'a éliminée de son index en janvier 2006. Les recherches sur "BMW" ramèneront uniquement des références sur son site mondial .

En 2005, l'UMP et plus particulièrement Nicolas Sarkozy ont été critiqués pour avoir acheté des dizaines de mots-clefs comme « émeute », « CPE », « Jack Lang »… renvoyant sur le site de l'UMP.

En haut



Google

Logo de Google

Google, Inc. (prononcé ) est une société fondée le 27 septembre 1998 dans la Silicon Valley, en Californie, par Larry Page et Sergey Brin, auteurs du moteur de recherche Google. Google s'est donné comme mission « d'organiser l'information à l'échelle mondiale et de la rendre universellement accessible et utile ».

Début 2008, Google valait quelque 210 milliards de dollars à la Bourse de Wall Street. Google posséderait le parc de serveurs le plus important du monde, avec environ 500 000 machines réparties sur 32 sites de par le monde.

Depuis 2001, Eric Schmidt en est le PDG (CEO). La société compte environ 20 000 employés dont la plupart travaillent au siège mondial : le Googleplex, à Mountain View, en Californie. En 2006, Google a acheté le site à SGI pour 319 millions de dollars.

Sur la période s'étalant de juin 2000 à novembre 2004, le moteur de recherche Google aurait indexé plus de 8 milliards de pages web, 1 milliard d'images. En 2008, Google annonce avoir identifié plus de 1 000 milliards de pages web.

En 1996, Google, alors baptisé BackRub, est le nom d'un projet de recherche sur lequel travaillent deux étudiants de l'université Stanford : Larry Page et Sergey Brin. Leur projet concerne les moteurs de recherche. Ils imaginent qu'un moteur de recherche qui analyserait les relations entre les sites web pourrait donner de meilleurs résultats que ceux donnés par les moteurs de recherche de l'époque, Altavista notamment.

Le nom de domaine « google.com » est enregistré le 15 septembre 1997.

Les deux étudiants recherchent des fonds pour créer leur entreprise. Ils renomment le projet Google, en référence au mot Gogol (voir ci dessous Origine du nom). Andy Bechtolsheim, un des fondateurs de Sun Microsystems, leur offre 100 000 $ après avoir vu ce dont était capable leur moteur de recherche. Grâce notamment à leurs familles et amis, ils arriveront à réunir 1 million de dollars et pourront lancer la société Google Inc. le 7 septembre 1998. Leur premier bureau sera un garage à Menlo Park, comme c'est souvent la tradition dans la Silicon Valley.

En février 1999, c'est 500 000 requêtes par jour que Google doit gérer, puis en août 3 millions. En mars, la société déménage à Palo Alto. Le moteur de recherche qui était jusque-là en version bêta, achève sa phase de test le 9 septembre.

Dès janvier 1999, la presse commence à se faire l'écho des performances de ce nouveau moteur de recherche. Le journal Le Monde écrit ainsi que le choix technologique de Google « s'avère très efficace à l'usage. Ainsi, une recherche avec les mots “Bill Clinton” sur Google renvoie d'abord au site de la Maison Blanche, alors qu'AltaVista ne fait apparaitre le site qu'après des dizaines d'autres références. ». Autre avantage : Google affiche les mots-clés en gras dans le contexte d'une phrase pour chaque lien alors que l'Altavista de l'époque ne fournissait que les liens eux-mêmes.

En juin 2000, Google est le premier moteur de recherche à avoir référencé un demi-milliard de pages web. Google signe cette année-là un partenariat avec Yahoo!, commence à proposer la publicité ciblée en fonction des mots-clés. À la fin de l'année, la Google Toolbar est proposée en téléchargement.

Larry Page et Sergey Brin font appel en mars 2001, à Eric Schmidt, le président de Novell, pour prendre la direction de l'entreprise. Le 4 septembre 2001, Google obtient la validation de son brevet concernant PageRank. Aujourd'hui Google est le premier moteur de recherche sur Internet, 80 % des internautes américains utilisent le moteur de recherche Google mais seulement 35 % des Chinois l'utilisent, préférant le moteur de recherche chinois : Baidu.

La compagnie se spécialise dans la détection de petites sociétés jugées prometteuses et susceptibles d'être valorisées par une synergie avec ses activités.

En 2001, Google lance le service Google Catalogs.

En mai 2002 : Google lance Google Labs, le laboratoire des services et applications de la société. Le 12 juin 2002, Sergey Brin annonce officiellement à Paris l'ouverture de la filiale française. En décembre, lancement de Froogle, un service d'achat en ligne.

En février 2003 Google rachète Pyra Labs pour 9 millions de dollars, le propriétaire de Blogger, un service de création de blogs. Google gère au quotidien 200 millions de requêtes par jour, soit 56 % des requêtes mondiales. En mai, Google News est décliné en version francophone.

L'année 2004 marque pour Google l'apogée de sa domination en matière de recherche : 84,9 % des requêtes sur le web sont faites auprès de Google. On peut expliquer cela grâce notamment à ses partenariats avec Yahoo, AOL et CNN. En effet, ces sociétés ont signé des accords pour que Google soit le moteur de recherche de leurs sites. C'est justement en février 2004 que Yahoo se sépare de Google pour développer son propre moteur de recherche. Cette année-là, Google lance Gmail et Google Desktop Search.

En août 2005, Google rachète Android, une start-up spécialisée dans le développement d'applications de téléphonie mobile.

En 2006, Google, tout comme les autres moteurs de recherche, accepte de brider son moteur de recherche afin de mieux s'implanter en République populaire de Chine. Ainsi à dater du 28 janvier 2006, une recherche images sur « Tian’anmen » affiche dans Google.fr la célèbre photo d'un étudiant barrant la route des chars, symbole des manifestations de la place Tian'anmen , tandis que sur Google.cn les résultats affichent des portraits de familles joyeuses ou photos de monuments. Toutefois, une telle censure s'applique aussi à des sites racistes, islamistes ou révisionnistes dans les versions française et allemande de Google.

Au mois de mai 2006 Google lance GWT (Google web Toolkit) un outil qui permet de développer des applications en Ajax. Cet outil est passé en open source en décembre 2006. Il est au cœur de la stratégie web de Google.

Le 9 octobre 2006, Google rachète YouTube pour un montant de 1,65 milliard de dollars en actions, ce qui constitue la plus grosse opération d'acquisition de Google jusqu'alors.

Fin novembre 2006, Google ferme Google Answers.

Le 2 septembre 2008, lancement dans 100 pays du navigateur Internet Google Chrome, logiciel Open source.

Un jour de 1938, le mathématicien américain Edward Kasner se demanda quel nom donner au nombre formé du chiffre 1 suivi de 100 zéros. Edward se tourna alors vers son neveu (9 ans) en visite à la maison et lui posa la question. Celui-ci répondit un mot enfantin : « un gogol », dont l'orthographe est devenue googol.

C'est ce mot que Kasner reporta fidèlement dans son traité Mathematics and the imagination, dont s'inspirèrent en 1998 Larry Page et Sergey Brin, quand ils créèrent Google. Par cette faute d'orthographe, Google à la place de googol, simple et facile à retenir deviendra célèbre dans le monde entier.

On peut aussi noter la similarité avec le mot anglais goggles signifiant "lunettes", dont les deux O de la marque rappellent la forme.

La devise de la société est Don't be evil (« Ne soyez pas mauvais »).

La société a parfois été prise à partie sur ce point, en particulier à propos du filtrage interdisant l'accès à certains sites ou à des pages contenant certains mots depuis la Chine. Elle a expliqué que, selon elle, mieux valait pour les usagers chinois un Google imparfait que pas de Google du tout. En particulier, google.cn veille à ne pas faire figurer sur ses pages de réponse les chaînes de caractères qui provoquent la déconnexion de l'utilisateur par les mécanismes de surveillance automatique que doivent assurer les fournisseurs d'accès.

Google repose principalement sur l'exploitation de la technologie PageRank.

Le premier brevet (US 6.285.999 B1, intitulé « Method for Node Ranking in a Linked Database »), déposé en janvier 1997 et enregistré le 9 janvier 1998, est la propriété de l'université de Stanford, qui a licencié cette technologie à Google en 1998 (amendée en 2000 et 2003), deux mois après sa fondation. Il s'agit d'une licence exclusive jusqu'en 2011, l'exclusivité prenant fin à cette date.

Les recherches qui ont abouti au développement de la technologie du PageRank ont été financée en partie par la National Science Fundation (Grant NSF - IRI-9411306-4). Il est donc précisé dans le brevet que le gouvernement a certains droits sur cette invention.

Google vend des mots clés aux enchères. Si une personne fait une recherche avec ce mot, les liens des sites de ceux qui ont participé aux enchères s'inscrivent dans la partie des liens commerciaux. Chaque fois qu'une personne sélectionne un de ces liens, la société concernée doit verser une certaine somme à Google.

Un site web peut accueillir les AdWords sur ses pages grâce au système AdSense, Google reverse une partie de ses gains à ce site.

Google est une des start-ups qui ont franchi sans encombre le krach du NASDAQ en 2001, notamment du fait qu'elle n'était pas cotée. L'entreprise s'est introduite en bourse par un système peu usité d'enchères en mai 2004 qui a comprimé de 5,5 à 1,5 % les commissions perçues par les banques d'affaires ; introduite à 80 $, l'action cotait 250 $ un an plus tard, ce qui valorisait l'entreprise à près de 74 milliards de dollars. Début 2006, l'action cote 460 $ environ, elle franchit la barre des 600 $ (609,62 $) le 8 octobre 2007, puis celle des 700 $ le 31 octobre 2007, ce qui la place au quatrième rang en termes de capitalisation à la Bourse de New York.

Avec les différentes crises financières de fin 2007 et début 2008 sur les différents marchés financiers, et l'annonce d'un probable rachat de Yahoo par Microsoft, l'action Google a chuté passant de 712 $ fin 2007 à 609 $ en février 2008.

Le code de l'action au NASDAQ est GOOG.

Le 20 décembre 2005, Time Warner annonçait que Google allait prendre 5 % de participation dans le capital de sa filiale AOL.

La multiplication des services proposés par Google engrange une demande accrue de renseignements sur les utilisateurs : suivi de la navigation et stockage des mots-clés, scan des mails dans Gmail, des informations livrées dans les formulaires, entre autres. Cela pose à chaque innovation la question du respect de leur vie privée, comme le note la philosophe et philologue Barbara Cassin dans son ouvrage sur Google. Google croise ces données pour affiner le profil des utilisateurs, et améliorer le ciblage des publicités sur internet.

Une telle concentration d'informations sur les individus et leur conservation inquiètent les organisations de défense de la vie privée sur internet, comme l'Electronic Frontier Foundation ou le "Groupe de travail de l'article 29" de la Commission européenne, une nouvelle forme de surveillance très sophistiquée et un danger potentiel pour la liberté des personnes. Récemment, Google fut placé tout en bas du classement élaboré par l'ONG Privacy International, qui dit de Google qu'elle est "ennemie du respect de la confidentialité en raison de la surveillance totale des utilisateurs".

En 2004, Google, associé à AOL, Amazon.com, CNet, eBay, Microsoft et Yahoo!, a pratiqué aux États-Unis du lobbying contre le Spyware Control Act en Utah obligeant de demander l'accord explicite de l'utilisateur pour activer des options de traçage de ses choix ou avant l'installation d'un logiciel espion. Les raisons de leur opposition, selon eux, étaient d'ordre technique et non éthique : dans la lettre envoyée au sénateur Valentine et au représentant Urquhart, ils reconnaissent les "très bonnes intentions" de la loi.

Au sujet des éventuelles techniques de traçage employées par Google, Google Watch, site de l'activiste américain Daniel Brandt, tente de démontrer les failles et le manque de neutralité de Google et propose un proxy, Scroogle, permettant de soumettre une recherche Google sans être épié d'une quelconque façon. Il dénonce entre autres sa censure orientée, dans d'autres pays comme la République populaire de Chine, ou les États-Unis, concernant l'invasion de l'Irak et la prison d'Abu Ghraib.

À ce sujet, Google a dans un premier temps refusé de se plier aux injonctions du gouvernement américain fin 2006 en ne lui donnant pas accès aux listes de recherche et URL qui lui étaient demandées pour contribuer à une loi sur la répression de la pédophilie. Néanmoins, ils ont ensuite remis 50 000 URL au gouvernement, mais le juge chargé de l'affaire a décidé que Google n'avait pas à remettre les listes de mots-clés demandées par le gouvernement.

En France, les garanties de respect de la vie privée apportées par la CNIL ne sont pas applicables à des services dont les serveurs sont situés hors du territoire national. Le refus de Google de se soumettre aux lois locales crée donc une extension de fait de la juridiction américaine.

Google Latitude est un service crée en 2009 permettant de déterminer la position d'une personne et ce par le biais de son téléphone portable. Ce service est sujet à controverse : on peut voir en Latitude un outil permettant de tracer les personnes, la vie privée peut donc être atteinte. Google répond aux sceptiques que cet outils a été conçu dans une autre optique : il permet par exemple de localiser des enfants...

À mesure que Google se développe et prend une importance de plus en plus considérable dans la gestion des informations mondiales, se développent en parallèle de nombreuses critiques d'une entreprise dont quelques hommes politiques (par exemple Jean-Noël Jeanneney, voir "Notes et références" plus bas) craignent qu'elle puisse abuser de sa position, notamment en recueillant des données très privées des internautes utilisant ses services, et en les utilisant, voire en louant l'usage, de manière abusive. Un nombre croissant d'instruments informatiques a ainsi été développé par différents groupes d'activistes et de militants pour limiter les capacités intrusives de Google. Il s'agit par exemple de masquer les publicités AdWords.

Parmi ces instruments, on peut citer le réseau Tor (« The Onion Router », littéralement : « le routage en oignon »), qui anonymise les internautes (le résultat visible avec Google est que les publicités ne sont plus ciblées) ; le logiciel Scroogle, un "Google Scraper" développé par l'activiste Daniel Brandt qui détourne le moteur de recherche, lui fournit une nouvelle adresse I.P. à chaque recherche, et accepte l’installation du cookie sur son serveur avant de le jeter à la poubelle ; ou encore l'extension pour Mozilla Firefox « Customize Google, » qui permet de rendre anonyme le cookie Google, et empêche Google Analytics de récolter des statistiques sur l'utilisateur. Par ailleurs, certains sites militant pour la défense de la protection des informations privées donnent des informations sur la manière dont les internautes peuvent faire valoir auprès des régies publicitaires, et notamment auprès de Doubleclick (acquise par Google), leur droit d'exiger que les données les concernant ne soient pas récoltées (elles le sont par défaut, mais il existe un système d'opt-out).

La question de savoir s'il vaut mieux à volume égal se voir présenter de la publicité non ciblée que ciblée reste évidemment un sujet de controverse. Voir Spam.

En haut



Source : Wikipedia