Les digg-like : une fausse bonne id??e

La recherche d'information int??ressante est un probl??me r??current sur le web auquel les digg-like ont cru apport?? une solution. J'expose, dans ce billet, ma th??orie pour expliquer cet ??chec et aborde les solutions qui, ?? mon avis, vont ??merger.

Dans Blogasty et les limites du web 2.0, j'avais abord?? le probl??me de l'intelligence collective et la qualit?? car blogasty promettait de « promouvoir les blogs selon la qualit?? de leurs billets ». Mais il est ??vident que d'une part la qualit?? est subjective et d'autre part l'information qui m'int??resse n'est pas toujours de qualit??. J'aime assez le site Je gal??re au taff bien que je ne le consid??re pas comme un site de qualit??. Les digg-like s'appuient sur la courbe popularis??e par Chris Anderson dans son article La Longue Tra??ne traduisant le fait qu'une minorit?? d'articles est pl??biscit?? par un majorit?? de personne.

Dessin de la courbe longue traine
La La longue tra??ne est repr??sent??e en jaune (image Wikip??dia)

Mais cette image est trompeuse pour deux raisons :

  • Un contenu populaire n'est pl??biscit?? que par un petit nombre d'utilisateur.
  • Ma courbe d'int??r??t ne se superpose pas ?? celle-ci.

Ne disposant pas de donn??es chiffr??es, j'expose ma th??orie avec des donn??es purement fictives, qu'il serait tr??s int??ressant de confront?? ?? la r??alit?? pour confirmer ou infirmer ce mod??le.Prenons l'exemple d'un site de social news (mais ce pourrait ??tre un [site de e-]commerce) comportant 1 000 000 articles et ayant 10 000 utilisateurs actifs. La courbe ressemblerait ?? quelque chose comme ??a :

Courbe
Distribution des articles en fonction de leur popularit?? d??croissante


La popularit?? d'un article est le rapport, exprim?? en pourcentage, entre le nombre de personne ayant vot?? pour un article et le nombre d'utilisateur du site. Ici l'article le plus populaire, le blockbuster a un score de Pmax = 1 % : il a obtenu 100 votes (je pense que dans la r??alit??, ce score est inf??rieur). Un article populaire n'int??resse qu'un faible pourcentage de lecteur.

Pla??ons-nous, maintenant du point de vue d'un lecteur ayant lu 100 articles qu'il a class?? du moins int??ressant (score = 1) au plus int??ressant (score = 100). Si l'on ne conserve, sur la courbe pr??c??dente, que ces 100 articles et que l'on superpose la courbe des scores de notre lecteur, je pense que nopus obtiendrons une courbe ressemblant ?? la suivante :

Courbes repr??sentant la distribution des articles lus en fonction de leur popularit?? d??croissante et de leur score
Distribution des articles en fonction de leur popularit?? d??croissante superpos??e au score obtenu

Les articles qui m'int??ressent le plus sont les moins populaires ! Dans ce cas comment un digg-like peut-il m'aider ?? trouver des articles int??ressants ?

Il est assez amusant de constater que les algorithmes de recommandation soient tr??s populaires dans le monde du e-commerce, ainsi que pour la musique et les DVD, mais pas du tout dans le monde l'information textuelle (journalisme, blogosph??re, etc.) geekomatik est le seul exemple dans ce domaine, ?? ma connaissance. Malheureusement, le syst??me de recommandation est, ?? mon avis, perdu au milieu de fonctionnalit??s peu ergonomiques et sans valeur ajout??, ce qui limite l'attrait du site, limite la taille de la communaut?? et limite donc la pertinence des recommandations. (Alexis, je suis pr??ts ?? reprendre nos ??changes si tu le souhaites.)

Que pensez-vous de cette th??orie ?



Poster un nouveau commentaire

Le contenu de ce champ est gardé secret et ne sera pas montré publiquement.
  • Les lignes et les paragraphes vont à la ligne automatiquement.
  • Allowed HTML tags: <a> <em><cite> <code><center> <script><ul><img> <ol> <li> <dl> <dt> <dd><p><br><embed><object><param>
  • You can use <object>, <embed> and <script> tags from the following sites to add media to your posts:

    • http://www.youtube.com
    • http://media.nowpublic.com
    • http://youtube.com
    • http://dailymotion.com
    • http://www.dailymotion.com

Plus d'informations sur les options de formatage

CAPTCHA
Cette question nous sert à déterminer si vous êtes un humain, un robot ou un extra-terrestre
11 + 0 =
Veuillez résoudre ce simple problème mathématique afin de poster votre commentaire. Par exemple pour 1 + 3 entrez : 4