La recherche d'information int??ressante est un probl??me r??current sur le web auquel les digg-like ont cru apport?? une solution. J'expose, dans ce billet, ma th??orie pour expliquer cet ??chec et aborde les solutions qui, ?? mon avis, vont ??merger.
Dans Blogasty et les limites du web 2.0, j'avais abord?? le probl??me de l'intelligence collective et la qualit?? car blogasty promettait de « promouvoir les blogs selon la qualit?? de leurs billets ». Mais il est ??vident que d'une part la qualit?? est subjective et d'autre part l'information qui m'int??resse n'est pas toujours de qualit??. J'aime assez le site Je gal??re au taff bien que je ne le consid??re pas comme un site de qualit??. Les digg-like s'appuient sur la courbe popularis??e par Chris Anderson dans son article La Longue Tra??ne traduisant le fait qu'une minorit?? d'articles est pl??biscit?? par un majorit?? de personne.

La La longue tra??ne est repr??sent??e en jaune (image Wikip??dia)
Mais cette image est trompeuse pour deux raisons :
- Un contenu populaire n'est pl??biscit?? que par un petit nombre d'utilisateur.
- Ma courbe d'int??r??t ne se superpose pas ?? celle-ci.
Ne disposant pas de donn??es chiffr??es, j'expose ma th??orie avec des donn??es purement fictives, qu'il serait tr??s int??ressant de confront?? ?? la r??alit?? pour confirmer ou infirmer ce mod??le.Prenons l'exemple d'un site de social news (mais ce pourrait ??tre un [site de e-]commerce) comportant 1 000 000 articles et ayant 10 000 utilisateurs actifs. La courbe ressemblerait ?? quelque chose comme ??a :

Distribution des articles en fonction de leur popularit?? d??croissante
La popularit?? d'un article est le rapport, exprim?? en pourcentage, entre le nombre de personne ayant vot?? pour un article et le nombre d'utilisateur du site. Ici l'article le plus populaire, le blockbuster a un score de Pmax = 1 % : il a obtenu 100 votes (je pense que dans la r??alit??, ce score est inf??rieur). Un article populaire n'int??resse qu'un faible pourcentage de lecteur.
Pla??ons-nous, maintenant du point de vue d'un lecteur ayant lu 100 articles qu'il a class?? du moins int??ressant (score = 1) au plus int??ressant (score = 100). Si l'on ne conserve, sur la courbe pr??c??dente, que ces 100 articles et que l'on superpose la courbe des scores de notre lecteur, je pense que nopus obtiendrons une courbe ressemblant ?? la suivante :

Distribution des articles en fonction de leur popularit?? d??croissante superpos??e au score obtenu
Les articles qui m'int??ressent le plus sont les moins populaires ! Dans ce cas comment un digg-like peut-il m'aider ?? trouver des articles int??ressants ?
Il est assez amusant de constater que les algorithmes de recommandation soient tr??s populaires dans le monde du e-commerce, ainsi que pour la musique et les DVD, mais pas du tout dans le monde l'information textuelle (journalisme, blogosph??re, etc.) geekomatik est le seul exemple dans ce domaine, ?? ma connaissance. Malheureusement, le syst??me de recommandation est, ?? mon avis, perdu au milieu de fonctionnalit??s peu ergonomiques et sans valeur ajout??, ce qui limite l'attrait du site, limite la taille de la communaut?? et limite donc la pertinence des recommandations. (Alexis, je suis pr??ts ?? reprendre nos ??changes si tu le souhaites.)
Que pensez-vous de cette th??orie ?

Poster un nouveau commentaire