Sections

Comment mieux évaluer le travail des élèves ?

Comment mieux évaluer le travail des élèves ?

18.05.2016, par
Des chercheurs testent actuellement, dans 70 collèges et lycées, une alternative au traditionnel système de notation : l’évaluation par compétences. Si les premiers résultats sont prometteurs, l’expérience est bien loin d’être finie. Décryptage.

La nouvelle a fait les gros titres de la presse française il y a quelques semaines : une étude scientifique préconiserait l’abandon des notes à l’école. Dans un pays attaché de longue date à la notation de 0 à 20, l’annonce a aussitôt fait l’objet de débats aussi intenses que… prématurés. En effet, les résultats dont les commentateurs se sont emparés ne sont que les tout premiers d’une expérience en cours, menée depuis la rentrée 2014 dans 70 collèges et lycées de l’académie d’Orléans-Tours. Cette étude ambitieuse livrera ses réelles conclusions dans de longs mois, en 2018. Il n’en reste pas moins qu’elle interroge déjà, et dans des proportions inédites, l’évaluation du travail scolaire telle qu’elle est pratiquée aujourd’hui.

Des notes subjectives et anxiogènes

« Contrairement à ce que l’on a pu lire çà et là, notre but n’est pas de faire disparaître la note pour le plaisir de la faire disparaître, mais d’en promouvoir un usage raisonné pour renforcer la qualité des apprentissages, précise d’emblée Alain Diger, doyen des inspecteurs pédagogiques de l’académie et instigateur de cette expérimentation. Une jauge est nécessaire pour les élèves et les parents. Mais la manière dont l’évaluation est pratiquée aujourd’hui dans la plupart des classes est excessivement centrée sur une notation systématique et, à ce titre, archaïque. »

De fait, nombre de travaux en docimologie (science de la notation) montrent que la notation chiffrée pèche par sa subjectivité, la valeur d’un 15, par exemple, variant d’un enseignant à l’autre dans n’importe quelle discipline. Autre biais majeur : la notation, en plus d’être anxiogène, n’est guère informative. « Une note est un indicateur très fruste, explique Alain Diger. Elle sert davantage aux élèves à se situer les uns par rapport aux autres qu’à identifier les points sur lesquels ils doivent concentrer leurs efforts pour progresser. Par ailleurs, la note, en exacerbant la compétition au sein de la classe, véhicule son lot de vainqueurs mais aussi de vaincus. Elle amplifie les inégalités scolaires et renforce le déterminisme social, des effets délétères dont le système éducatif français souffre exagérément. »

Evaluation scolaire
Cours de français dans une classe de sixième. L'étude sur l'évaluation des compétences est menée depuis la rentrée 2014 dans 70 collèges et lycées de l’académie d’Orléans-Tours.
Evaluation scolaire
Cours de français dans une classe de sixième. L'étude sur l'évaluation des compétences est menée depuis la rentrée 2014 dans 70 collèges et lycées de l’académie d’Orléans-Tours.

La note amplifie
les inégalités
scolaires
et renforce le
déterminisme
social.

D’où l’idée de tester de la sixième à la seconde un nouveau type d’évaluation à l’échelle d’une académie entière (une première en France !), et de confier la supervision d’une partie de cette expérience à des chercheurs en psychologie pour en mesurer scientifiquement les effets. Conduite auprès d’un échantillon de 1 627 élèves de troisième répartis en deux groupes1 et centrée sur trois disciplines (français, histoire-géographie, mathématiques), l’étude pilotée par Céline Darnon et Pascal Huguet, du Laboratoire de psychologie sociale et cognitive2, et Isabelle Régner, du Laboratoire de psychologie cognitive3, fait la part belle à l’évaluation par compétences.

Le principe de cette approche est de « pointer les acquis des élèves et de focaliser leur attention sur les connaissances et les savoir-faire qui leur restent à acquérir, rappelle Isabelle Régner. Cela les amène à délaisser les stratégies d’apprentissage dites de surface (recours au par cœur, centration sur les contenus les plus importants en vue d’un examen…) au profit de stratégies de profondeur (recherche d’informations complémentaires, point de vue critique sur le contenu des cours…). De même, ils tendent à considérer leurs pairs comme des collaborateurs plutôt que comme des compétiteurs. » La note, enfin, est réduite à la portion congrue. Et celle qui figure dans le bulletin scolaire transmis aux parents à la fin de chaque trimestre n’est plus une moyenne, dont le principe est désormais très contesté, mais un indicateur calculé au vu des compétences acquises.

Les effets positifs de l’évaluation par compétences

Les premiers résultats de cette étude en cours permettent d’ores et déjà de dégager quelques conclusions. Dont ce constat : l’évaluation par compétences produit des effets positifs en mathématiques, où les élèves cherchent moins à se comparer. Et, lorsqu’elle est mise en place de manière collective et concertée entre enseignants, les élèves réussissent mieux les épreuves standardisées du brevet. Autre effet avéré, toujours en mathématiques : l’écart entre élèves de milieux favorisés et élèves de milieux défavorisés a fondu de moitié (3 points de différence dans le groupe expérimental, contre 6 points dans le groupe témoin). « Cela est assez phénoménal si l’on veut bien se souvenir qu’aucune réforme du système éducatif, au cours des trente dernières années, n’est parvenue à un tel résultat, commente Pascal Huguet. L’évaluation par compétences semble à même d’aider l’ascenseur social à redémarrer », sachant que la France est le pays où l’influence de l’origine sociale des élèves sur leurs performances scolaires est la plus marquée.

Le retrait, voire
la suppression des
notes, ne signifie
pas la fin
de l’évaluation.
C’est même
presque l’inverse.

Le procédé exerce en outre une influence bénéfique sur tous les élèves, quel que soit leur niveau. Autrement dit, il n’entraîne pas les meilleurs vers le bas. En revanche, son efficacité est moins nette en histoire-géographie et indétectable en français pour des raisons qui restent à élucider. « Le retrait, voire la suppression des notes, ne signifie pas la fin de l’évaluation, comme certains croient pouvoir l’affirmer, insiste Céline Darnon. C’est même presque l’inverse. Cette méthode, qui se traduit souvent par un surcroît de travail pour les enseignants et exige qu’une culture de collaboration et d’échange se développe entre eux, génère une évaluation bien plus informative pour l’élève qui sait clairement et constamment où il en est. »

Reste que les premières conclusions des chercheurs, aussi stimulantes et utiles soient-elles pour faire sortir la question de l’évaluation de l’enclos de l’opinion, et l’installer dans le champ des sciences, demandent à être confirmées. L’expérience menée l’an dernier dans l’académie d’Orléans-Tours n’est que le premier étage d’une fusée dont la mission se poursuivra jusqu’en 2017. L’année scolaire 2014-2015 a été « une année pilote, dit Pascal Huguet. Cette phase 1, avec son lot d’imperfections liées notamment au manque de formation de certains professeurs à l’évaluation par compétences, nous a permis d’engranger 800 000 données, mais peu de certitudes. Nous restons par conséquent prudents et sommes les premiers à dire :“Cette expérimentation est encourageante, mais il est indispensable de la répliquer pour s’assurer de la solidité des effets observés et disposer de mesures complémentaires aux épreuves standardisées du brevet” ».

Evaluation scolaire
Cette professeure d’anglais remplit une fiche individuelle d’acquisition des compétences.
Evaluation scolaire
Cette professeure d’anglais remplit une fiche individuelle d’acquisition des compétences.

L’année scolaire 2015-2016, dans cette optique, se veut une année de maturation. L’occasion pour les enseignants d’histoire-géographie et de français impliqués dans l’étude de remettre sur le métier leurs pratiques pédagogiques et d’en imaginer de nouvelles, en phase avec les exigences de l’évaluation par compétences. « Nous voulons homogénéiser la population enseignante pour ne pas nous retrouver avec, d’un côté, des professeurs qui ont déjà une grande habitude de cette méthode et, de l’autre, des enseignants qui la découvrent ou ne la maîtrisent pas suffisamment, explique Isabelle Régner. C’est pourquoi, tout au long de cette année, nous laissons les professeurs les moins expérimentés se familiariser avec cette alternative à la note. À la rentrée prochaine, une fois que ces derniers seront pleinement opérationnels, nous réactiverons le dispositif méthodologique que nous avons élaboré et que nous aurons, entre-temps, perfectionné. »

Rendez-vous en 2018 pour les résultats définitifs

L’expérimentation parvenue à son terme à la fin de l’année scolaire 2016-2017, et la masse de données recueillies une fois traitée, les chercheurs seront en mesure de savoir si l’évaluation par compétences, à défaut d’être la panacée à tous les maux de l’école, offre à davantage d’élèves la possibilité de progresser non seulement en mathématiques, mais aussi en histoire-géographie et en français. De même espèrent-ils extraire des filets de cette seconde expérience in collegio des données relatives à l’impact de ce mode d’évaluation sur des compétences transversales (maîtrise de l’oral, capacité à s’intégrer dans un travail collectif, conduite de projet…).

Demain, la
pédagogie sera
assistée par
des machines qui
délivreront non
pas des notes, mais
des évaluations-
diagnostics
extrêmement fines.

Viendra, enfin, l’heure de publier, sans doute fin 2018. L’ambition des chercheurs, sur ce plan, est double. D’une part, rendre compte de leur expérimentation dans une revue faisant autorité en matière d’éducation, telle que le Journal of Educational Psychology, et apporter ainsi une « touche française » à un débat qui a cours en ce moment en Europe et ailleurs dans le monde. D’autre part, rédiger un rapport en français à destination des acteurs du terrain éducatif (ministère, corps d’inspection, chefs d’établissement, professeurs, ESPE4…). Ce document explicitera la méthodologie employée et détaillera les résultats d’une manière plus abordable qu’un article destiné à une publication scientifique internationale.

Par ailleurs, l’évaluation par compétences devrait croiser à brève échéance la route des nouvelles technologies. « La révolution numérique a commencé de traverser l’école et ce tropisme va nécessairement s’intensifier, assure Pascal Huguet. Demain, la pédagogie sera massivement assistée par des machines qui délivreront non pas des notes, mais des évaluations-diagnostics extrêmement fines et recentreront l’élève sur certains apprentissages. Dans ce nouveau paysage scolaire, les professeurs seront toujours indispensables car ce sont eux qui auront, entre autres, à concevoir les contenus des ressources numériques mises en ligne. Mais ce jour-là, la note appartiendra à la Préhistoire… »

 

Notes
  • 1. L’un soumis à une évaluation classique par notes (classes du « groupe témoin »), l’autre à nouveau type d’évaluation (classes du « groupe expérimental »).
  • 2. Unité CNRS/Univ. Blaise Pascal.
  • 3. Unité CNRS/Aix-Marseille Univ.
  • 4. Écoles supérieures du professorat et de l’éducation.
Aller plus loin

Auteur

Philippe Testard-Vaillant

Philippe Testard-Vaillant est journaliste. Il vit et travaille dans le Sud-Est de la France. Il est également auteur et coauteur de plusieurs ouvrages, dont Le Guide du Paris savant (éd. Belin), et Mon corps, la première merveille du monde (éd. JC Lattès).

Commentaires

8 commentaires

Bonjour, Merci pour cette article qui rappelle entre autre que la science, ça prend du temps ! J'aurais cependant besoin de précisions pour bien comprendre : - Quand vous écrivez : "en mathématiques : l’écart entre élèves de milieux favorisés et élèves de milieux défavorisés a fondu de moitié (3 points de différence dans le groupe expérimental, contre 6 points dans le groupe témoin)." Parle-t-on ici de points sur une note sur 20 ? Si c'est le cas, comment cela a-t-il été évalué puisque justement on ne donne plus de notes ? Ou bien parle-t-on des notes du brevet uniquement ? - "la France est le pays où l’influence de l’origine sociale des élèves sur leurs performances scolaires est la plus marquée." ... parmi l'ensemble des pays de l'UE ? carrément du monde entier ? Merci !

Les "débats" sur cette étude seraient donc prématurée mais la communication tapageuse ne le serait pas ? Une étude qui pose bien des questions, autant par sa méthodologie que par sa conformité étonnante, dans la chronologie comme dans les conclusions, avec les aspirations réformistes du ministère de l'Éducation nationale. Quant au prospectivisme numériste de Pascal Huguet, il ne laisse pas d'interroger...

Bonjour, Que penser d'une combinaison, (pour obtenir un examen ou pour autoriser le passage dans la classe supérieure), d'un 08/20, en français, avec un 17/20 en EPS, quand bien même les matières sont pondérées à l'aide de coefficients ? Rares, sont les matières où le programme est "couvert" aisément au cours de l'année. Pourquoi ne pas décomposer le dit programme en "objectifs" ? Exemple : physique-chimie en seconde = 220 objectifs, dont 150 obligatoires et 30 optionnels. La difficulté est alors de pondérer le quantitatif des objectifs obligatoires dans chaque matière. Mais des enseignants responsables et "centrés" sur les seuls élèves y parviendront. Il y a lieu de rappeler qu'un objectif est défini par la façon dont sa maîtrise sera contrôlée : on ne doit pas "connaître" les divisions avec virgules au diviseur et au dividende (pas plus qu'une note de 14/20, à ce propos n'a de sens), par contre : l'objectif "division avec virgules" sera atteint à compter du moment où 5 exercices pratiques seront effectués sans erreur dans le cadre d'un DST. Un objectif est obtenu ou non. 150 objectifs, en cours de seconde de physique chimie ce n'est pas 149, 137 ou 125 pour gonfler un taux de réussite ou remplir une classe !! Dans ces conditions, un élève n'est plus dans l'attente du couperet d'une instance, il lui suffit de suivre son tableau de bord de ses objectifs annuels, pour SAVOIR et même pour décider de l'obtention ou non de l'examen ou du passage de classe.

J'ai testé un système de compétences comparable à celui que vous décrivez pendant 3 ans dans mes classes. Je n'ai pas obtenu que des avantages. 1/ Les familles ont des difficultés à se retrouver dans la multiplicité et les libellés des compétences. 2/ Les familles sont dans l'illusion de la réussite de leur enfant. 3/ Les élèves au profil psychologique de compétiteurs travaillent moins. 4/ Le professeur utilise plus d'énergie à comptabiliser des items finement et moins à d'aider les élèves. 5/ Globalement le travail est un peu moins sérieux et les élèves progressent un peu moins.

Bonjour, Il me semble très important de faire un travail sérieux sur ce sujet. Comme professeurs, nous subissons trop souvent les écueils d'études aux preuves insuffisamment robustes. 1/ Un échantillon de 3 000 élèves serait un minimum. 2/ L'évaluation des acquis des élèves doit être standardisée et externe (le brevet est à 60% donné au contrôle continu). Évaluation à l'entrée et à la sortie de l'étude (anonyme et pas corrigée par les professeurs qui ont les classes) 3/ Les professeurs qui expérimentent ne doivent pas être des militants pédagogistes convaincus par avance. Il doit y avoir un équilibre d'équipes qui ont un "à priori" positif et négatif. 4/ Il faudrait aussi travailler sur les bénéfices de la notation chiffrée classique. 5/ Pour conclure il faudrait regarder si les élèves s'en sortent mieux ensuite au lycée et dans le supérieur : 3 ans est une durée d'étude beaucoup trop courte pour conclure, il faut au moins 4 années du collège + 3 ans du lycée = 7 ans. Il y a donc beaucoup de chemin à parcourir avant d'avoir l'ombre d'une réponse scientifique sur ce vaste sujet. Quand à avoir une conférence de consensus sur ce sujet, cela nécessiterait des dizaines d'études sérieuses (qui n'existent pas). Ne refaisons pas les mêmes erreurs que pour les méthodes de lecture.

Haro sur les notes ? bien des affirmations générales dans le texte du journal du CNRS. Combien d'enseignants corrigent le travail des élèves sans indications sur ce qui est correct ou pas (quand cette évaluation est pertinente), sans commentaires "locaux" sur les divers éléments d'un travail ? sur le caractère "traumatisant" des notes. Ce qui est probablement traumatisant est de se trouver / sentir en échec et de ne pas progresser. Les notes permettent aussi cela, et pas seulement les codages verts, jaunes, rouges, ou équivalent dans des listes de "compétences". Les commentaires des enseignants précisent aussi les progrès. Certes une moyenne (de quoi que ce soit d'ailleurs, et la psychologie sait combien on en trouve dans les publications de recherche !) donne une information très réduite, mais - à part les évaluations terminales "qualifiantes" d'un niveau scolaire (brevet, bac) - ni les enseignants ni les élèves ne considèrent que l'évaluation au cours d'une année scolaire s'y limite. Par ailleurs, la note ne donne aucun élément sur les conditions de l'étude. Or, outre des problèmes soulevés par d'autres commentaires, de nombreux travaux de recherche ont montré l'existence d'un effet d'une expérimentation en tant que telle (effet Hawthorne, étudié par le sociologue Mayo dans les années 30, qui montre que le simple fait de participer à une expérience peut être un facteur qui a une conséquence importante en termes de motivation. Le fait d'être l'objet d'une attention particulière de la part de l'expérimentateur et le fait d'avoir été choisi comme sujet de l'expérience peut contribuer à donner une meilleure estime de soi), qu'on peut rattacher à l'effet placebo en médecine. Par ailleurs, la variabilité des notes dépend d'une multiplicité de déterminants, dont les moments dans la vie scolaire (cf. Chartier, http://id.erudit.org/iderudit/1024891ar à propos du passage 3ème / 2de). Des observations à différents niveaux, indiquent, qu'en mathématiques en tout cas, la définition commune d'un barème par des enseignants les conduit à définir plus précisément les éléments évalués - et à discuter sur le contenu même de la tâche. Il y a un effet en retour sur l'enseignant par rapport à ses élèves d'une évaluation plus précise de leur réalisation des tâches. On pourrait interpréter ainsi le fait que chez es enseignants de maths de l'expérimentation évoquée il y a à la fois collaboration accrue et effet positif sur les élèves en difficulté. Bref, l'article du Journal du CNRS écrase la complexité et tire des conclusions bien au-delà du raisonnable des résultats scientifiques. La conclusion sur la pédagogie assistée par des machines qui donneront des évaluations diagnostiques extrêmement fines, et recentreront les élèves sur certains apprentissages appelle la question : "quand?" et quels travaux de recherche en didactique seront nécessaires ? Pour fixer les idées : des outils d'évaluation et de régulation différenciée sur les compétences en algèbre élémentaire (collège) sont aujourd'hui accessibles en ligne, après 20 ans de travaux collectifs à partir d'une modélisation initiale (Grugeon, 1995). Un peu de "réserve" et de précision n'auraient pas nui à un article, même considéré comme de vulgarisation...

Je commente ce passage de la réponse de Brasme: "Dans ces conditions, un élève n'est plus dans l'attente du couperet d'une instance, il lui suffit de suivre son tableau de bord de ses objectifs annuels, pour SAVOIR et même pour décider de l'obtention ou non de l'examen ou du passage de classe". J'enseigne dans le 1er degré depuis 16 ans. J'ai toujours connu l'évaluation par compétences, et il s'est toujours agi d'atteindre les objectifs, tant pour les élèves, que pour les professeurs (entendre par là: si ce n'est pas encore acquis, il va falloir s'y prendre autrement jusqu'à ce que ça le soit). Ce que cette partie du commentaire de mon collègue amène, c'est l'implication des élèves en AMONT de toute intention pédagogique. Le "tableau de bord", est ce qui constitue la base de l'idée de portfolio. Pour une raison qui m'échappe, on feint d'ignorer que l'élève n'est tout simplement pas conscient, ou n'est pas informé, de ce qu'on attend de lui, avant qu'il ne reçoive les résultats de son évaluation. Si les objectifs en termes de compétences attendues ont toujours été clairs dans l'esprit des enseignants, pourquoi ne pas les formuler AVANT d'entreprendre les apprentissages visés? En pédagogie inversée, on "annonce la couleur", on laisse l'élève se représenter ce qu'il devra savoir faire, avant de le guider pour y parvenir. Et c'est une condition qui me semble essentielle pour que les élèves puissent être réceptifs. L'influence du milieu socio-culturel est palpable à ce moment clef: il y a les familles où l'on sait "lire" les attentes, et accompagner les enfants. Et les familles où la lecture de ces codes n'est pas innée. Il reste à ces enfants, la mission de décrypter une partition à l'oreille là où d'autres ont pris des cours de solfège. Pourquoi ne pas rétablir un peu d'équité, en les associant tous, à la lecture des programmes, et à l'explicitation des compétences attendues? que vous gardiez des notes par la suite ne sera plus un problème. Il s'agira de scores qui valideront des compétences acquises, ou non, voire, partiellement acquises. Un exemple? Les examens de Cambridge ESOL. Les objectifs sont annoncés: il suffit de lire le CECRL et de se situer par rapport au niveau que l'on vise. Les compétences sont détaillées une à une. quand on passe l'examen, elles sont bien distinguées les unes des autres, et la grille d'évaluation est claire et accessible. Les candidats savent ce qui est attendu d'eux dans chaque champ. Le résultat est communiqué sous forme de notes sur 100, donc, de pourcentages. On estime une compétence atteinte au delà de 50%, rien de neuf. Par contre...On tient compte de ce qui "dépasse les expectations", ce qui au plus vaut une mention aux examens en France. J'ai passé un First certificate pour faire valider un niveau minimal B2 en Anglais. Je savais ce que je devais "accomplir". Lorsque j'ai reçu les résultats, surprise: non seulement le B2 était atteint et validé, mais la nature de mes réponses a été prise en compte, et le diplôme porte la mention " a dépassé les expectations, niveau C1". Cela signifie qu'on situe l'évaluation dans un spectre, et que l'on renseigne l'étudiant sur son exact niveau, et non pas, sur sa capacité à valider un niveau de base. quel est l'intérêt, pour un élève Français, actuellement, d'atteindre plus que 10/20?????????? C'est le problème "moral" que j'ai rencontré dans ma pratique avec l'instauration du premier "socle commun de connaissances". Il s'agissait sans doute de garantir une base commune, mais dans les faits cela a modifié les objectifs qui n'étaient plus orientés vers les IO, mais vers la validation de ce socle. Le nouveau socle est plus ambitieux. Mais combien de temps encore, ces mesures prises dans le premier degré, vont-elles devoir attendre, pour être appliquées dans le second degré?
Pour laisser votre avis sur cet article
Connectez-vous, rejoignez la communauté
du journal CNRS