[Internet] L’indexation est-elle soluble dans le(s) bouton(s) ?

ndlr: Ceci est un article de Olivier Ertzscheid extrait de son blog Affordance.info. L’article est sous licence CC:  BY-NC-SA – Vous pouvez également lire l’article à la source http://affordance.typepad.com/mon_weblog/2011/09/lindexation-est-elle-soluble-dans-les-boutons-.html

—|—| —| —| —| —| —| —| —| —| —| —| —| —| —| —| —| —| —| —| —|

Au commencement étaient les folksonomies. Il y a encore peu de temps, en gros depuis 2005 et malgré le scepticisme intial à leur encontre, les folksonomies (indexation collaborative) étaient partout présentes sur le web. Leur âge d’or culminant entre 2006 et 2008. La plupart des outils d’accès, de YouTube à Dailymotion en passant par Delicious ou FlickR leurs réservaient une place centrale comme mode d’accès à l’information.

Folkso-partout
(Diapositive extraite de ma présentation au congrès de l’ABF en 2007, « Indexation sociale et bibliothéconomie de masse. » Voir notamment les diapos 11 à 29)

Elles ont aujourd’hui presqu’entièrement disparu ou n’occupent plus qu’une portion congrue des modes d’accès et de recherche d’information. Tout au plus peut-on observer la survivance – pour le coup très vivace – de ces folksonomies au travers des hashtags sur Twitter, une survivance qui se cantone à un seul biotope documentaire quand la promesse initiale des folksonomies était de s’étendre, par contamination, à l’ensemble de l’écosystème du web.

L’indexation collaborative avait pourtant fait la preuve de son efficience comme supplétif aux processus d’indexation normés ; à la condition qu’elle franchisse un certain effet de seuil, elle permettait de compléter et parfois même de rejoindre ou de remplacer – sur certains fonds documentaires spécifiques – les attendus d’une indexation « classique ». De mon point de vue, et pour ce qui est du domaine de la recherche d’information, les folksonomies venaient utilement suppléer un manque du mot caractéristique du flou cognitif qui préside à l’essentiel des scenarios de recherche d’information (c’est à dire à l’absence de besoin formalisé dans l’esprit du requêtant) ; en présentant des mots en excès au lieu d’une zone de recherche en défaut de mots, les folksonomies permettaient de palier l’absence de besoin documentaire formalisé, elles jouaient le rôle d’un irremplaçable dispositif d’amorçage cognitif ou de navigation par rebond (phénomène de sérendipité).

Un amorçage reposant sur l’étalement et le déploiement de signifiants, eux-mêmes déclencheurs de la construction d’une recherche de signifiés.

Sur toutes ces questions, on pourra notamment relire l’article « Etude exploratoire des pratiques d’indexation sociale comme une renégociation des espaces documentaires. Vers un nouveau big bang documentaire ? » disponible sur ArchiveSic.

Puis vinrent les boutons. « Like » par ici, « +1 » par là, « Retweet » à gauche, « Recommend » et autres « Share on … » à droite, l’essentiel de nos interactions documentaires en ligne se résume à une activité de pousse-bouton (et vous savez tout le mal que je pense du web pousse-bouton). Nous ne qualifions plus des contenus, nous les partageons. Une accélération qui est une altération du temps de transmission (mais aussi de persistance) des documents et qui peut parfois jouer un rôle déterminant (y compris dans le domaine politique et/ou social, cf le récent printemps arabe), mais qui ôte aussi la promesse dont étaient porteuses les folksonomies : celle de faire de chacun d’entre nous un archiviste d’une mémoire collective en construction et en réagencement permanent.

Lazyweb. Il existe pourtant un point commun essentiel reliant boutons et indexation collaborative : c’est leur faible coût cognitif.

« « le marquage (« tagging ») élimine la phase de décision (choisir la bonne catégorie) et dissipe la phase de paralysie d’analyse (« the analysis-paralysis stage ») pour la plupart des gens. (…) Il offre un retour social et sur soi-même immédiat. Chaque « tag » traduit un peu de vos centres d’intérêts et les ancrent dans un contexte social immédiat. La beauté du marquage (« tagging ») est qu’il est inscrit dans un processus cognitif déjà existant sans lui ajouter de coût cognitif supplémentaire. » Sinha R., « A cognitive analysis of tagging. », citée dans Ertzscheid O. et Gallezot G., « Etude exploratoire des pratiques d’indexation sociale comme une renégociation des espaces documentaires. Vers un nouveau big bang documentaire ?« 

Capitalisme linguistique et libéralisme cognitif. Mais. Mais là où les folksonomies favorisaient un partage entre pairs, une thesaurisation intra-communautaire ouverte sur l’extérieur, là où les folksonomies créaient une valeur / valorisation documentaire partageable par tous et accessible à chacun, les boutons improprement désignés comme boutons « de partage » laissent toute la valorisation, toute la thésaurisation à la seule discrétion des sites hôtes (Google pour le +1, Facebook pour le Like, etc.). Ce partage là n’en est pas un. Ce partage là est l’avatar d’un capitalisme linguistique, d’un libéralisme cognitif qui vise à mettre à disposition de quelques-uns l’usufruit du labeur documentaire de chacun d’entre nous (oui c’est une thèse marxiste, et alors ? :-).

Nous n’en sommes encore pourtant qu’au degré zéro du bouton.Techcrunch, souvent bien informé, annonce que Facebook pourrait prochainement lancer une nouvelle série de boutons : « Read », « Listened », « Watched », et « Want ». « Lu » ou « à lire », « écouté » ou « à écouter », « Vu » ou « à voir ». Et « Désiré » ou « Obtenu » selon que l’on se place dans l’optique de l’internaute activant ces boutons dans une logique orientée-tâche, ou dans l’optique du site collecteur qui disposera ainsi d’une vue encore plus fine de nos comportements connectés. Là encore le lien avec les raisons du succès de feu les folksonomies est éclairant. En sus de leur faible coût cognitif, les folksonomies fonctionnèrent parce qu’elles permirent de mettre en place ce dont l’indexation classique n’arrivait pas à rendre compte : une indexation orientée-tâche, qui permette d’apposer sur des contenus, sur n’importe quel type de contenus, non pas simplement des marqueurs sémantiques descriptifs mais des stratégies contextuelles et performatives (comme le montrèrent nombre d’étude dont j’ai ce soir la flemme de retrouver les références, plus d’un tiers des mots-clés utilisés dans une approche d’indexation collaborative étaient des verbes d’actions : « à lire », « à consulter », « à imprimer », etc …).

La guerre des boutons.

Premier enseignement : l’indexation semble donc effectivement – et malheureusement – soluble dans les boutons. Deuxième enseignement :l’engouement actuel pour les boutons peut-être expliqué par au moins deux des raisons déjà à l’origine du succès des folksonomies (voir notamment la diapo 25 d’une de mes interventions à la BPI) : leur faible coût cognitif et leur aspect « orienté-tâche ».

Troisième enseignement : les folksonomies reposent sur une base marxiste (elles postulent un phénomène d’auto-régulation au sein de la communauté qui les promeut et les utilise, un partage de la valeur ainsi créée) ; à l’inverse, les boutons jouent au maximum sur une dérégulation de la fonction du clic, ils tendent à la rendre la plus triviale possible, à faire baisser le cours de sa valeur d’échange pour pouvoir en tirer une valorisation maximale. Pour le dire autrement, ce n’est plus ni le producteur de contenu ni le consommateur qui touchent les dividendes de leur travail (travail de production pour le premier, travail de signalement et de re-production pour le second) mais c’est l’intermédiaire qui se sucre sur leur dos. Si je ne craignais de sombrer dans l’analogie vasouillarde, je pourrai aisément filer la métaphore de cette question des marges documentaires bénéficiaires à l’aide d’une analogie avec les enseignes de la grande distribution ; avec Facebook ou Google ou Amazon ou Apple jouant le rôle du supermarché, les internautes producteurs de contenus (blogueurs notamment) dans celui des exploitant agricoles spoliés de leurs marges, et les consommateurs que nous sommes enchaînés à leur caddy (souvenez-vous du Kindle-caddy, de la boutique et du bazar).

Quatrième enseignement, cette guerre des boutons est évidemment d’abord une guerre des données.

Guerre-boutons

(diapositive – n°39 – extraite de ma présentation sur les données personnelles à l’école d’été en architecture de l’information)

Transformer la recommandation en prédiction. La pierre philosophale du web. Si la multiplication des boutons se confirme et avec elle l’avènement d’un web presse-bouton, les quelques firmes qui survivront dans cet écosystème pourront alors envisager, tels de nouveaux alchimistes, de transformer le plomb en or. De transformer des ingénieries de la recommandation en technologies de la prédiction.

De faire de chacune de leurs « suggestions » une sujétion de nos désirs.

C’est déjà une chose connue et largement analysée que celle d’une économie de l’attention elle-même dépendante de l’amplification sans cesse croissante et de la captation sans cesse plus fine du spectre relationnel et de l’étendue sociale de nos recommandations. Aujourd’hui est déjà atteint ce qui semblait encore hier être le rêve un peu fou de quelques doux dingues de l’algorithmie : celui d’un web implicite, celui demoteurs de divination capables, en travaillant sur leur inépuisable base de donnée des intentions, d’apporter des réponses avant même que ne soient posées les questions.

Mais si la suggestion reposant sur une analyse tendancielle peut se prévaloir d’un fondement – et d’une réalité – mathématique et statistique, la prédiction disposant d’un niveau de fiabilité garanti demeure, en l’état actuel des connaissances, une pure construction de l’esprit. La réalité est heureusement plus complexe que les modèles mathématiques, informatiques ou physiques qui en rendent pourtant objectivement compte.

Pourtant, au cours de la rédaction de ce billet, plusieurs signaux viennent confirmer cette tendance autour de laquelle, demain peut-être, s’organiseront nos modes d’accès à l’information. Ici un nouveau moteur, Recorded Future, mélangeant modèles prédictifs, analyse comportemantale et ingénierie linguistique. Là une police prédictive se reposant sur la capacité d’un algorithme à prédire les prochaines scènes de crime. Ici encore, un programme capable de prédire le printemps arabe comme les fluctuations de la bourse.

Et partout, partout, la même antienne, celle de prédire l’avenir en décodant le présent numérique. Une ambition qui n’est pas une erreur factuelle, mais qui est une faute interprétative.

Big Data et grandes questions. Il faut ici lire et relire attentivement ledernier article de Danah Boyd et Kate Crawford, « Six provocations for Big Data« , pour mesurer les enjeux et les problèmes liés aux règne des Big Data :

  1. « Automating Research Changes the Definition of Knowledge.
  2. Claims to Objectivity and Accuracy are Misleading
  3. Bigger Data are Not Always Better Data
  4. Not All Data Are Equivalent
  5. Just Because it is Accessible Doesn’t Make it Ethical
  6. Limited Access to Big Data Creates New Digital Divides »

Sur ce dernier point (les nouvelles fractures numériques), Danah Boyd et Kate Crawford rappellent :

« But who gets access? For what purposes? In what contexts? And with what constraints? While the explosion of research using data sets from social media sources would suggest that access is straightforward, it is anything but. As Lev Manovich (2011) points out, ‘only social media companies have access to really large social data – especially transactional data. An anthropologist working for Facebook or a sociologist working for Google will have access to data that the rest of the scholarly community will not.’« 

Et de conclure en citant Derrida :

« La démocratie effective se mesure toujours à ce critère essentiel : la participation et l’accès à l’archive, à sa constitution et à son interprétation. »

L’après diction. La prédiction, le modèle prédictif que nous annoncent et nous proposent les firmes des Big Data est pour l’instant une simple pré-diction, la présentation de ce que nous aurions pu dire doublée d’une incitation à le dire, à dire ce que les autres nous font dire, d’une injonction faite aux autres de le considérer comme ayant été dit. Cette pré-diction est également une privation. Une privation de la parole possiblement inscrite, la privatisation de l’accès à une mémoire collective, qui ne nous laisse comme horizon que celui d’une « après diction », le choix binaire de consommer ou non, le choix binaire de se souvenir en dedans du système ou d’être oublié en dehors de lui, le hold-up documentaire de l’archive. Reste que, comme le disait encore récemment Bernard Stiegler :

« Reste que la démocratie est toujours liée à un processus de publication – c’est à dire de rendu public – qui rend possible un espace public : alphabet, imprimerie, audiovisuel, numérique. »

Laisse aller, c’est une valse. L’acte du publication comme participation à l’indexation du monde. L’archive, la publication, l’indexation. Une valse à trois temps. La recommandation, la prescription, la prédiction. Une valse à mille temps. « Trois cent trente trois fois le temps de bâtir un roman » comme disait l’autre. Un roman d’anticipation qui repose sur une illusion fondamentale dont Jean-Michel Salaün fournit l’une des clés essentielles :

« (…) la multiplication des documents et des genres dans toutes sortes de registres et leur transformation témoignent d’une relation fiévreuse à notre passé, une sorte d’interrogation existentielle sur notre présent face à un futur angoissant dont les termes se renouvellent sous nos yeux. »

Et de poursuivre :

« Mieux ou pire, le numérique par ses capacités calculatoires permet de reconstruire des documents à la demande et nous donne l’illusion d’avoir toutes les réponses à nos questions avant même qu’elles ne soient posées, comme si notre futur était un destin déjà inscrit dans les machines. »

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.