De la recherche sociale au web social
1/3 : D’Altavista à Google +1, la guerre des boutons a commencé

Le lancement officiel du bouton Google +1 début juin signe le début d’une guerre ouverte entre le moteur de recherche vedette et l’alliance Facebook/Microsoft au sein du moteur Bing.

Pourquoi une guerre ? Pourquoi sommes nous tous concernés ? Parce que ces boutons constituent le point de départ d’une évolution majeure d’internet qui démarre avec la Recherche Sociale, et qu’il nous sera de plus en plus difficile d’ignorer ce mouvement de fond, y compris en dehors d’internet.

Les boutons « J’aime » de Facebook et « +1″ de Google, placés sur une page web, permettent au visiteur de signaler son intérêt pour le contenu de cette page :

Les systèmes de vote ou de recommandation ne datent pas d’aujourd’hui.  La grande nouveauté induite par ces deux systèmes réside dans la possibilité d’être informé au cours d’une requête sur un moteur de recherche, d’une recommandation de page en provenance d’un « ami » Facebook, d’un Twittos que l’on suit ou d’un contact Google. Cette intrusion de notre réseau personnel dans nos recherches porte le nom de Social Search, Recherche Sociale en français. La personnalisation des recommandations est en rupture avec les algorithmes anonymes de Google et de ses clones.

C’est le cas par exemple lorsque je recherche un article sur les liens faibles : Google me signale que mon ami Philippe Ameline, que je suis par ailleurs sur Twitter et qui est dans mes contacts mail, a recommandé un article d’InternetActu.

Cette notion de résultat lié à un réseau personnel va plus loin que la simple recherche d’information et s’intègre dans le Web social, traduisant le virage communautaire du Web 2.0 et ses interactions qui vont bien au delà de la seule quête d’information.

Les développements en cours ou à venir du Web Social sont stimulants, excitants pour certains, effrayants pour d’autres. Ils sont au coeur de mon activité sur le web et de ma réflexion personnelle et je vous propose un triptyque de trois articles sur ce thème.

Le premier article, qui suit cette introduction, s’intéresse à l’émergence de la recherche sociale, depuis la naissance de Google jusqu’au bouton “J’aime” de Facebook et le tout récent +1 de Google.

Le deuxième article analysera à la fois les espoirs réels ou fantasmés placés dans le Web Social, mais surtout les craintes fondées ou non liées à la perte d’intimité et d’individualité qu’il implique.

Un troisième volet tentera d’imaginer l’impact du Web Social, dans notre vie future et le fonctionnement de nos sociétés.  Michel Serres pense que nous arrivons à la fin du néolithique. Homo sapiens démarre-t-il une nouvelle ère  ? Faut-il s’en réjouir où au contraire se rebeller contre un montre orwellien ? À suivre…

1) Naissance de la Recherche Sociale

Le concept de Social Search, recherche sociale en français, serait né en 2004 d’après Wikipedia, qui le traduit par “moteur de recherche collaboratif”.

Pour l’encyclopédie communautaire et pour d’autres, la recherche sociale se caractériserait par l’intégration de recommandations  personnalisées, provenant généralement d’experts, dans les résultats d’un moteur de recherche.

Google CSE, un des premiers outils de recherche sociale

L’annuaire Yahoo est l’ancêtre de la recherche d’information collaborative, suivi de l’annuaire Dmoz. La recherche s’effectuait dans une liste forcément limitée de sites sélectionnés.

Le concept d’annuaire ne séduit plus personne. L’annuaire Yahoo n’est même plus présent sur www.yahoo.com, il est caché ici. Dmoz est envahi par les spammeurs.

C’est donc du côté des moteurs de recherche que va se développer la recherche collaborative.

L’alliance du CISMeF (pionnier du web santé) et de Google en 2006 constitue un bon exemple de recherche collaborative « post-annuaire »: une version “custom” du moteur Google permet d’interroger exclusivement l’énorme catalogue de pages et de sites indexés depuis plus de 10 ans par l’équipe de Stefan Darmoni et Benoît Thirion.

Je présidais à l’époque l’association des Médecins Maîtres-Toile et je fondais de grands espoirs sur Google CSE (Custom Search Engine) pour apporter au public des outils de recherche d’informations médicales fiables.

Google CSE proposait une autre option  combinant la sélection de sites avec les résultats naturels de Google, sans exclusion : les pages provenant des sites sélectionnés s’affichent en début de résultats, mais ils sont simplement valorisés, il n’y a pas de manques. Cette solution permettait de corriger l’effet “silence” de la présélection, qui privait l’internaute de pages potentiellement pertinentes qui n’auraient pas été sélectionnées.

Comme pour les autres options de Google CSE, le moteur personnalisé acceptait le mode collaboratif : la possibilité d’ajouter des sites à la liste pouvait être partagée avec de nombreux co-éditeurs au sein du projet plus large Google co-op.

Cette option n’a pas non plus connu de succès, pas plus que MedHunt de la fondation suisse HON qui fonctionne sur un principe proche.

Comment expliquer l’échec de cette version primitive de la recherche sociale ?

La principale raison de l’échec de la recherche collaborative 1.0, c’est à dire fondée sur des experts,  est qu’elle se plaquait sur un moteur de recherche qui utilisait déjà la recherche sociale 2.0 !

L’algorithme de Google se montrait suffisamment puissant pour mettre en valeur les meilleurs résultats sans sélection préalable par l’intervention d’experts ou de tiers certificateurs !

Enfin, si elle était collaborative, cette recherche  n’était pas vraiment sociale. Le distingo est subtil mais important : dans notre espace personnel nous faisons en priorité confiance à ceux que nous connaissons. Les aéropages d’experts plus ou moins anonymes perdent peu à peu leur crédit, comme j’ai pu le vérifier dans le domaine médical avec Cyril Quémeras et Hugues Raybaud. De façon plus générale, le prestige des experts truffés de conflits d’intérêt s’effrite de plus en plus.

L’algorithme de classement du moteur de recherche Google est fondé sur l’analyse des liens entre les documents indexés, et non sur leur popularité auprès des visiteurs comme on le croit trop souvent. Google a révolutionné la recherche d’information en abandonnant quasiment l’analyse des critères intrinsèques objectifs (analyse du contenu, recherche des mots clés) pour privilégier des critères extrinsèques subjectifs (liens entre documents, récursivité, comportement des utilisateurs). Lorsque vous affichez le résultat d’une requête, vous bénéficiez sans vous en rendre compte de l’analyse du réseau socio-éditorial qui entoure votre mot-clé.

Ce principe peut être schématisé de façon très réductrice par le PageRank de Google.

Ou par le défunt moteur Kartoo, qui proposait une visualisation graphique des liens entres sites.

Je ne développerai pas plus cet aspect traité en détail ici.

Toujours est-il que plaquer de la recherche collaborative expertale sur un moteur de recherche 2.0 revenait à vouloir envoyer des profs ou des parents piloter les discussions de leurs élèves/enfants sur FaceBook. J’avais personnellement négligé cet aspect, de même que j’ai cru à tort à Knol, un autre échec de Google. Cette encyclopédie met en avant des réseaux d’experts rédacteurs. Elle n’a pas réussi à détrôner le pourtant imparfait et critiqué Wikipedia, pur produit 2.0 avec ses millions de collaborateurs anonymes et ses pages réécrites en permanence.

Pour améliorer Google, il fallait donc trouver autre chose que l’injection de jus de cervelles d’experts. A côté de ces essais avortés de recherche collaborative 1.0, Google a continué à perfectionner son service de base, en apportant de nouvelles fonctions

La nécessaire évolution de Google et des autres moteurs vers la personnalisation de leur service

Pendant les années 2000, Google a connu un tel succès que son algorithme révolutionnaire s’est imposé à la totalité des moteurs de recherche, en tout cas ceux qui ont choisi de survivre. Pour résister à ces suiveurs, Google a cherché à s’en démarquer par la recherche d’une pertinence toujours meilleure, en fournissant un service de plus en plus personnalisé.

Cette personnalisation a été progressive, consistant notamment à tenir compte des recherches et comportements passés de l’utilisateur pour lui proposer des résultats plus pertinent. Le stockage des informations comportementales était associé initialement à la création d’un compte Google. Désormais, un simple cookie placé sur votre ordinateur permet au moteur de vous reconnaître pour vous servir des résultats personnalisés.

Pendant plusieurs années, cette personnalisation du service est restée attachée aux données de chaque utilisateur, malgré quelques tentatives de prise en compte de son réseau (Yahoo et Myweb)

Jusqu’alors, le mystère entourant l’algorithme du moteur vedette ne suscitait que quelques réactions négative. Mais le stockage des préférences ou de l’historique de navigation par les moteurs de recherche a suscité une levée de boucliers chez les utilisateurs les plus soucieux de la protection de leur informations personnelles. Cet aspect sera plus particulièrement développé dans le deuxième article (à venir) de ce triptyque. Toujours est-il que Google recueillait des informations liées à la navigation et sans doute déjà au réseau de l’utilisateur. Fidèle à sa tradition, il ne donnait aucune visibilité aux critères qui dictaient l’affichage des résultats, désormais différents pour chaque internaute.

La naissance et l’explosion de Facebook ont fait vaciller Google

Pendant que Google régnait en maître sur la recherche d’information, un autre géant était en train de naître.

FaceBook fort de ses centaines de millions d’utilisateurs balayait en quelques années le primitif Myspace. Le site social créait un réseau de liens d’une densité effarante autour de chaque utilisateur : amis, amis d’amis, sites et pages appréciés, préférences, photos,  goûts.

FaceBook est venu troubler les expériences de Google labs avec un banal bouton associé à un message simplissime mais percutant :  “J’aime”. D’un clic, chaque membre du réseau Facebook peut signaler à ses « amis » un document qu’il juge digne d’intérêt.

Il ne s’agit pas de recherche d’information, de “pull”, mais de signalement d’information, c’est à dire de “push” : l’information est poussée vers les amis sans action de leur part. Ce simple bouton a connu un succès considérable.

Google avait tenté de suivre le mouvement avec son service “Buzz” permettant de partager ses coups de coeur avec ses contacts. Il existe un bouton Buzz censé fournir un service proche de celui du J’aime de Facebook. Ce service a constitué un nouvel échec pour Google.

Voyant son grand rival en difficulté, Microsoft, a senti une opportunité, d’autant que son nouveau moteur de recherche Bing ne parvenait pas à atteindre un trafic significatif. Il s’est donc allié avec Facebook pour proposer une nouvelle forme de recherche sociale tenant compte des millions de liens sociaux et de recommandations personnalisées apportées par les clics sur les boutons J’aime.

Il s’agit de mentionner l’existence d’une recommandation lors de la recherche sur le moteur. Au contraire de la recherche collaborative 1.0, cette recommandation n’émane pas d’un expert plus ou moins connu, mais d’un membre de votre réseau personnel.

Sentant le vent du boulet, Google a immédiatement réagi avec son bouton +1, largement diffusé début juin 2011. Là encore, il s’agit d’afficher dans les résultats du moteur une recommandation émanant des contacts de l’internaute en quête d’information.

Cette intégration sociale du web réalisée par Facebook/Bing  et Google constitue une évolution majeure du web, sans doute aussi disruptive que la naissance de l’algorithme de Google en 1998 et sa généralisation dans les années 2000.

Reprenons les grandes étapes de la recherche d’informations sur le web

Avant 2000 : le web pré-social
- Moteurs 1.0 fondés sur l’analyse intrinsèque des documents (Altavista, Excite, Lycos…)
- Annuaires d’experts (Yahoo et autres)

2000 – 2006 : Google incarne une recherche socio-éditoriale invisible mais pertinente
- Explosion du trafic de Google, moteur 2.0 fondé sur l’analyse des liens entre les documents
- Disparition ou googlisation des autres moteurs
- Mort progressive des annuaires d’experts sous toutes leurs formes.

2006 – 2011 : Personnalisation de la recherche et échec du retour des experts
- Personnalisation progressive des résultats des moteurs de recherche, essentiellement à partir d’historiques de navigation et de sélection antérieure des résultats par l’utilisateur.
- Echec des tentatives de surcouches “experts” sur les résultats des moteurs de recherche.

2010 – maintenant  : Intégration et visibilité du réseau social de chaque internaute dans les résultats de ses recherches
- Naissance du bouton J’aime de Facebook et alliance avec Bing pour faire apparaître le réseau de l’utilisateur dans le résultat de ses recherches.
- Création du bouton +1 par Google avec le même objectif.

A mon sens la guerre sans merci que Google va mener contre l’alliance que certains appellent déjà Facebing va être très stimulante. Il s’agit d’une vraie recherche sociale 2.0 car elle fait intervenir notre propre réseau d’experts, nos apomédiaires comme l’explique Eysenbach dans le domaine de la santé :

Eysenbach: Medicine 2.0: The Second Wave On The Web

Les raisons qui me font parler de rupture sont les suivantes :

- Nous fonctionnons déjà de cette façon dans la vraie vie : ce qui nous importe, c’est l’avis des gens en qui nous avons déjà confiance : NOTRE médecin, NOTRE avocat, NOTRE frère qui travaille dans le nucléaire, NOTRE ami amateur éclairé en photo, NOTRE amie qui connaît les meilleurs restaurants du coin etc.

J’ai eu l’occasion de vérifier à quel point la personnalisation des recommandations était importante. J’ai déjà cité plus haut une enquête sur les critères de fiabilité de l’information médicale pour les professionnels. Des généralistes qui fréquentent des listes de discussion étaient interrogés sur la fiabilité ressentie des sources d’information.

Parmi les options proposées figurait :
- L’opinion majoritaire des confrères (les pairs) sur la liste de discussion.
- L’opinion pondérée par la prise en compte de l’émetteur d’une opinion.

Comme vous le voyez, le résultat est fondamentalement différent. J’avais introduit cette distinction suite à un pré-test dans un autre espace professionnel : la réaction spontanée et imprévue pour l’option « avis des confrères » avait été “ce n’est pas la majorité des avis qui compte, je tiens compte de l’opinion que j’ai du confrère qui s’exprime”.

C’est un mécanisme proche de la récursivité du PageRank de Google, mais avec un facteur humain supplémentaire qui apporte un gain de confiance très important.

Un autre contexte m’a permis de vérifier cette attirance pour la personnalisation des recommandations. Je travaille avec Philippe Ameline et Dominique Sauquet à un projet de site fondé sur des échanges de recommandations de confrères entre médecins. Nous n’avons pas encore implémenté la couche “recherche sociale” qui permet à l’utilisateur de savoir si les recommandations émanent de ses amis proches. Or les premiers tests mettent en évidence une méfiance vis-à-vis de l’anonymat des recommandations, anonymat malheureusement nécessaire pour éviter le compérage et les recommandations réciproques.

Il est clair que dans une optique de réseau étendu, fait de liens forts et de liens faibles, notre recherche d’information a beaucoup à gagner à la prise en compte de cette composante sociale, de ces interactions affectives et subjectives qui rétablissent les liens humains.

Nous verrons dans le troisième article que ce fonctionnement social pourra nous emmener plus loin que la simple recherche d’information.

Mais il nous faudra d’abord analyser les réticences, les peurs et les réactions hostiles qui accompagnent cette atteinte à l’individualité, à la vie privée, et à l’espace de confidentialité auquel nous aspirons naturellement. Ce sera donc l’objet du prochain article de ce triptyque.

 

Cette entrée a été publiée dans Non classé. Vous pouvez la mettre en favoris avec ce permalien.

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

*

Vous pouvez utiliser ces balises et attributs HTML : <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>