2.2.1 Résultats globaux

Les expériences présentées au tableau 2.2 fournissent un total de 369 comparaisons binaires entre les versions illustrée et non illustrée. Plusieurs de ces expériences donnent ainsi lieu à plus d’une seule comparaison, soit parce que la variable indépendante comprend plus d’une seule version illustrée du texte, soit parce que la ou les comparaisons sont effectuées au moyen de plus d’une seule mesure dépendante (pour la définition d’une comparaison binaire, voir section 2.1).

Le tableau 2.2.1 indique pour l’ensemble des comparaisons binaires la nature de l’effet principal, qui est fixé au seuil de signification de 5 % (alpha = 0,05):

Pour faciliter la lecture des tableaux-synthèses qui suivent, les résultats bruts ont été traduits en pourcentage. En plus, un pourcentage pondéré a été ajouté afin de pallier au déséquilibre entre les expériences quant au nombre de comparaisons binaires. Le résultat non pondéré accorde en effet un poids plus considérable aux expériences qui donnent lieu à plusieurs comparaisons binaires. Le résultat pondéré permet de corriger cette inégalité en accordant globalement le même poids à chacune des expériences dans le calcul global.

Tableau 2.2.1
Comparaison des versions illustrée et non illustrée au moyen d’une mesure de compréhension de texte (tableau-synthèse)

   

ill > ni

ni > ill

non sig

Total et %
(rangée)

Total Non pondéré (score)
Non pondéré (%)
Pondéré (%)

133
(36 %)
(43 %)

4
(1 %)
(2 %)

232
(63 %)
(55 %)

369
(100 %)
(100 %)

 

Cent trente-trois (133) des 369 comparaisons binaires signalent une supériorité significative de la version illustrée sur la version non illustrée en ce qui concerne la compréhension de texte (ill > ni). Dans quatre expériences, la supériorité inverse est significative (ni > ill), la présence de l’illustration y étant identifiée comme élément d’interférence. Dans 232 comparaisons, finalement, la différence entre les versions illustrée et non illustrée est non significative (non sig ou ill = ni).

Une remarque d’ordre méthodologique s’impose ici, remarque qui sera d’ailleurs tout aussi importante pour l’interprétation correcte des autres tableaux-synthèses. En effet, les manuels en méthodologie de recherche expérimentale soulignent généralement l’asymétrie qui existe entre les résultats significatifs et non significatifs en ce qui concerne leur interprétation. Lorsqu’une hypothèse s’avère significative, on est en droit d’affirmer que la différence postulée existe réellement et n’est pas simplement un artefact expérimental. Cette affirmation est relative au seuil de signification fixé d’avance, généralement de 5 %: l’affirmation peut s’avérer fausse une fois sur vingt. Lorsqu’une hypothèse est non significative, par contre, le degré de certitude que l’absence d’une différence significative soit réelle n’est pas aussi élevé. Souvent, la probabilité d’erreur liée au résultat est élevée au point de rendre dénuées de tout fondement les prévisions. C’est pourquoi l’hypothèse nulle (i.e. absence d’une différence significative) ne peut être confirmée, contrairement à l’hypothèse alternative qui prévoit une telle différence. L’absence d’une différence significative entre la version illustrée et la version non illustrée, dans une expérience donnée, ne doit donc jamais être interprétée comme preuve pour la non-existence d’une telle différence. Plus prudemment, on dira que l’expérience en question ne permet pas de confirmer l’hypothèse alternative, sachant que cette formulation n’est pas synonyme avec l’affirmation que l’hypothèse nulle soit confirmée. La répétition dans les mêmes circonstances d’une expérience dont le résultat est significatif devrait aboutir au même résultat, sauf dans 5 % des cas. La répétition d’une expérience dont le résultat est non significatif, par contre, n’aboutit pas au même résultat non significatif avec une certitude analogue.

Comme conséquence directe de cette mise au point, il faut éviter de comparer de façon absolue le nombre de résultats significatifs et non significatifs. Dans une méta-analyse, par exemple, le nombre de résultats significatifs peut être de loin inférieur au nombre de résultats non significatifs tout en ayant un impact global significatif (pour plus de renseignements à ce sujet, voir par exemple Glass et al., 1981; Hedges et Olkin, 1980). Dans les tableaux-synthèses du présent ouvrage, le fait saillant réside dans la comparaison des résultats qui sont significatifs: ill > ni vs ni > ill.

Qu’on s’appuie sur le pourcentage pondéré ou non pondéré, le tableau 2.2.1 souligne clairement la contribution positive de l’illustration à la compréhension de texte: 133 comparaisons binaires indiquent une supériorité significative de la version illustrée sur la version non illustrée du même texte, comparativement à seulement quatre, qui indiquent le contraire.

Les études de Weintraub (1960), Popham (1969), Harber (1983) et Rose (1986) sont les seules à soutenir que l’illustration exerce un effet néfaste sur la compréhension de texte. Ces quelques contre-exemples sont rares au point qu’il paraît justifié d’examiner de plus près leur méthodologie de recherche. Rappelons que dans les études du présent chapitre, l’illustration est globalement compatible avec le texte, les études à support pictural délibérément incompatible étant traitées ailleurs (voir chap. 8).

Parmi les quatre études à contre-courant, la thèse de doctorat de Weintraub (1960) mérite une attention particulière puisque, dans les années 1970, elle a joué un rôle de premier plan dans le débat concernant l’utilisation de l’illustration dans l’apprentissage des premiers mots écrits en lecture. L’expérience de Weintraub a été menée en salle de classe afin qu’elle se rapproche le plus possible des conditions normales de l’enseignement en classe. Ce souci d’ " écologie expérimentale " s’est traduit par des moyens de soutien variés accordés à l’écolier en cas de difficulté de lecture:

In giving directions for reading the stories and taking the tests, the writer, who worked directly with all the children in collecting the data, informed the subjects that any words not know might be asked of him or of the classroom teacher if she were in the room. (...) Prior to having the children read or look at a story, the writer introduced, by writing on the board, the names of characters to be found in the story and many nouns and other words which might have been new to most of the children. Many times a slight introduction to the story was given also (Weintraub, 1960, p. 31-32).

Si louable que puisse paraître une telle démarche sur le plan pédagogique, il reste qu’elle diminue substantiellement la validité interne de l’expérience. Comme on fournit aux lecteurs une aide supplémentaire en cas de difficulté, l’illustration risque de perdre dans l’expérience sa raison d’être, celle de soutien à la compréhension du texte. Expérimentalement parlant, cette aide supplémentaire constitue en fait une variable parasite, non contrôlée, qui bénéficie aux lecteurs dans le traitement texte non illustré. Les lecteurs peuvent compenser pour l’absence de l’illustration par les questions qu’ils peuvent adresser aux personnes-ressources. Dans le même ordre d’idée, il est d’ailleurs fort révélateur que les lecteurs faibles, comme le rapporte l’auteur, se servent le plus de l’aide offerte (" It was noted that the poorer readers asked for a great many more words ", Weintraub, 1960, p. 32). C’est en effet ces mêmes lecteurs qui performent le mieux en absence de l’illustration, comparativement à la condition expérimentale illustrée. Il semble aussi que la supériorité significative des lecteurs de la version non illustrée soit favorisée par la nature du posttest: ses items ont été dûment sélectionnés de façon à porter uniquement sur les informations non illustrées (voir Note du résumé de l’étude).

Signalons le parallélisme entre les études de Weintraub (1960) et de Samuels (1967) concernant le soutien fourni aux lecteurs et les résultats auxquels elles mènent. Dans Samuels (1967), des enfants de première année du primaire ont appris des mots, présentés hors contexte, avec ou sans l’illustration. En phase d’apprentissage, l’aide a été fournie aux enfants en cas de difficulté. (Le terme rétroaction, utilisé par Samuels, nous paraît inapproprié puisque l’aide fournie aux enfants représente en réalité le stimulus crucial sans lequel il n’y aurait pas eu d’apprentissage, dans le cas du groupe sans illustrations.) Comme dans l’expérience de Weintraub (1960), cette aide a pu surtout être bénéfique aux enfants dépourvus d’illustrations, et en particulier aux lecteurs débutants faibles. Le degré d’apprentissage des enfants qui a été vérifié au moyen d’un posttest non illustré (liste de mots) en témoigne. Dans l’expérience de Samuels comme dans celle de Weintraub, le fait que les lecteurs soient aidés dans leur tâche constitue une variable parasite significative dont l’effet à elle seule, quoique confondu avec le traitement expérimental, explique la supériorité de la version non illustrée. La méthodologie de Samuels (1967) a été critiquée par plusieurs (p. ex. Montare, Elman et Cohen, 1977; Arlin, Scott et Webster, 1978, Arlin, 1980). Comme nous croyons, l’essentiel de cette critique s’applique également à l’étude de Weintraub (1960) même si, dans ce cas, la dépendance des enfants de l’aide fournie par les personnes-ressources n’était que partielle, vu la présence du contexte linguistique que procure le texte.

Dans Harber (1983), une autre étude ayant observé un effet pictural négatif, le résultat se présente sous forme d’interaction aptitude x traitement. Ainsi, les enfants identifiés comme ayant des difficultés d’apprentissage réussissent significativement mieux après la lecture de la version non illustrée des textes, tandis que les enfants issus de classes dites normales réussissent significativement mieux après la lecture de la version illustrée. Si intéressant qu'un tel résultat d’interaction puisse paraître, il faut mentionner que les textes de lecture présentés aux deux populations ne sont que partiellement les mêmes. Ce manque d’équivalence diminue la validité interne de l’expérience puisque l'interaction observée dans l'étude pourrait bien être attribuable au manque de contrôle expérimental du matériel picto-verbal plutôt qu’à l’absence ou à la présence de l’illustration, les deux variations étant confondues. Aussi, l'auteur semble avoir utilisé intégralement le matériel de lecture et d'évaluation du Gray Oral Reading Test, matériel dont la pertinence à des fins d’analyse picto-verbale paraît discutable. À l’instar de Harber (1983), Rose (1986) utilise un manuel de lecture déjà existant pour en extraire les textes et, en partie, les questions de compréhension administrées au posttest. Aussi, les renseignements fournis dans cet article sont nettement insuffisants pour qu’on puisse se faire une idée précise de la nature du matériel de lecture et d’évaluation. La portée réelle des résultats expérimentaux de Popham (1969) nous paraît également discutable, deux des trois comparaisons illustré - non illustré étant non significatives, dont une manifestant une supériorité tendencielle inverse.

En résumé, les expériences répertoriées au tableau 2.2 confirment clairement l’hypothèse voulant que la présence de l’illustration exerce un effet positif sur la compréhension de texte.

Dans les sections 2.2.2 - 2.2.8, nous examinerons ce résultat à la lumière de certaines caractéristiques des expériences (sujets, matériel expérimental, etc.), caractéristiques qui ne sont pas elles-mêmes des variables indépendantes. Des méta-analyses font souvent intervenir de telles informations. L’âge des sujets par exemple, puisqu’il risque de varier d’une étude à l’autre, fait partie de ces paramètres susceptibles d’interagir avec la variable picturale d’intérêt dans ce chapitre, i.e. la présence et l’absence de l’illustration. Sept paramètres qui, répétons-le, n’ont pas eux-mêmes le statut d’une variable indépendante dans les expériences concernées ont été identifiées (voir le chapitre 3 pour l’analyse des interactions entre variables).

Quelle est la pertinence d’une synthèse des résultats inter-études en fonction de paramètres qui ne sont pas eux-mêmes des variables? N’est-il pas préférable de restreindre l’analyse des interactions possibles aux variables identifiées comme telles dans les expériences? En fait, nous croyons que les deux types de synthèse sont valables et qu’ils peuvent servir de sources de renseignements complémentaires, puisque chacun a des points forts et des points faibles. Le premier type de synthèse (cf. chap. 2.2.2 - 2.2.8) permet de tenir compte du plus grand nombre d’études possible, ce qui augmente la représentativité des conclusions. Par contre, puisque la variable picturale est étudiée à la lumière d’un paramètre qui ne varie que d’une étude à l’autre (une " variable " inter-études, en quelque sorte), l’effet de ce paramètre risque d’être confondu avec l’effet d’autres paramètres, à moins qu’un contrôle statistique des paramètres par des moyens appropriés soit possible. Malheureusement, plusieurs des paramètres n’étant pas spécifiés dans toutes les expériences, la tentative d’étudier la contribution relative de chaque paramètre au moyen d’une régression multiple a dû être abandonnée: trop d’expériences auraient dû être exclues. Le deuxième type de synthèse (cf. chap. 3) permet d’étudier l’interaction de deux variables issues de la même expérience, ce qui garantit la validité interne des résultats et des conclusions qui en résultent. Par contre, le nombre d’études sur lesquelles une telle synthèse peut s’appuyer est nettement plus limité.

Essayons d’illustrer les deux options à l’aide d’un exemple. Selon une hypothèse d’interaction bien connue, le mode d’appréhension du texte par les sujets (lecture vs écoute) interagirait avec l’illustration (présence vs absence). L’effet positif de l’illustration sur la compréhension du texte en situation d’écoute serait supérieur à celui en situation de lecture. La logique sous-jacente d’une telle hypothèse d’interaction veut que la perception auditive du texte et la perception visuelle de l’illustration aient un plus grand effet facilitateur sur l’emmagasinage et le traitement de l’information picto-verbale que la perception uni-modale qui prévaut en situation de lecture. La vérification expérimentale d’une telle hypothèse d’interaction se fait généralement au moyen d’un plan expérimental qui croise les deux variables d’intérêt (2 x 2). La manipulation expérimentale des variables s’impose si l’on veut maximiser la validité interne des résultats. Par contre, le nombre restreint des études permettant l’analyse de ce type d’interaction risque de limiter les généralisations possibles. Devant ce dilemme, une démarche complémentaire consiste à comparer l’ensemble des études dans lesquelles les sujets lisent des textes en présence ou en absence de l’illustration avec celles dans lesquelles les sujets écoutent des textes en présence ou en absence de l’illustration. L’avantage principal d’une telle synthèse réside dans la diversité échantillonnale des études, une diversité favorisant la généralisation des résultats au-delà de l’expérience individuelle et donc permettant la découverte de tendances générales applicables à des situations variées. Son point faible est toutefois, rappelons-le, son manque de contrôle des variables parasites, avec tous les impondérables que cela entraîne. Les tendances générales dégagées aux tableaux-synthèses 2.2.2 - 2.2.8 doivent être interprétées en conséquence.

suite...