Parcours Sup, de l’examen des dossiers à l’analyse de données
Les précautions prises dans certaines filières pour anonymiser quelques informations (nom, âge, adresse) en vue d’une plus grande équité entre candidats font un peu sourire quand on voit à quel point l’examen des dossiers, pour accéder en classe préparatoire mais aussi à certaines facultés, est en train d’évoluer sur le modèle de l’analyse prédictive de données, méthode en usage dans de nombreux secteurs de la société (finance, politique, commerce), dépassant bientôt de toute la puissance des algorithmes et de l’exploitation informatique de l’information les possibilités de sélection connues jusque-là par nos traditionnelles commissions d’examen.
Comme le dit le site du ministère, l’examen des dossiers c’est effectivement la prise en compte des notes, des rangs, des avis – de professeurs ou de chefs d’établissement – pour opérer un premier classement. Mais cette base ne reste pas sans correctifs. Un savoir né de l’expérience dans la formation peut permettre aux enseignants d’affiner ce classement : ceux-ci peuvent alors valoriser telle ou telle matière, tel ou tel commentaire, tel ou tel établissement, telle ou telle académie, accorder plus de valeur au rang qu’à la moyenne, à telle option plutôt qu’à telle autre, et de la sorte un système de bonus/malus peut venir corriger le classement issu du premier tri.
Or, dans la mesure où les dossiers sont désormais numérisés dans la plupart des établissements, il est possible de donner des instructions à l’ordinateur allant bien au-delà des repérages, intuitions ou connaissances des seuls enseignants. Un logiciel tirera d’autres informations, se fondant par exemple sur des statistiques lexicales (nombre d’occurrences de tel ou tel mot aux connotations positives ou négatives) ou numériques (fiabilité de telle ou telle note dans telle ou telle matière, voire chez tel ou tel professeur), et surtout, s’appuyant sur le croisement d’informations fournies par les dossiers de ceux qui ont déjà intégré les meilleures écoles ou réussi leur formation jusqu’en Master 2 et qui définissent dès lors les caractéristiques des meilleurs profils.
L’ordinateur conserve une mémoire et peut établir des opérations – corrélation, paramétrage, statistique – conduisant à des informations bien plus fiables que celles issues des moyens d’examen traditionnels. D’une certaine manière l’enseignant, bien qu’à l’origine des algorithmes introduits dans ce traitement des dossiers, se retrouverait dépossédé de l’appréciation ultime de ces candidatures. Les prévisions ou estimations artisanales des enseignants d’aujourd’hui laisseraient place à une analyse prédictive scientifique.
Ces perspectives d’évolution, ces glissements déjà en cours, sont ambivalents : ils accroissent la sûreté de la sélection mais renforcent en même temps le sentiment d’inégalité. Si l’analyse de données dans le cadre scolaire peut rendre un système de sélection plus performant, il y a peu de chances qu’il le rende plus juste, plus ouvert à tous. Si Parcours Sup tend à toujours plus d’adéquation entre les candidatures et les formations du supérieur il y a peut-être à craindre que l’usage de ce genre d’outils informatiques accentue le poids d’un destin social pesant sur le monde de l’éducation.
Les décideurs (ministère, chefs d’établissement, professeurs) sauront-ils tempérer ces logiciels, sauront-ils offrir un avenir plus que de décider d’un futur pour les prochains étudiants ? Deux livres récents peuvent nous aider à répondre à cette question : l’ouvrage de Cathy O’Neil : Algorithme, la bombe à retardement (Les Arènes, 2018) fournit des raisons de s’inquiéter, celui de Serge Abiteboul et Valérie Peugeot, Terra Data. Qu’allons-nous faire des données numériques ? (Le Pommier, 2017), quelques raisons d’espérer.
Pascal Caglar
Réel problème, que cette “délégation” de pouvoir à l’informatique. Les orientations bibliographiques sur cette question sont précieuses.