2.2.1 Résultats globaux
Les expériences présentées au tableau 2.2 fournissent un total de 369 comparaisons binaires entre les versions illustrée et non illustrée. Plusieurs de ces expériences donnent ainsi lieu à plus dune seule comparaison, soit parce que la variable indépendante comprend plus dune seule version illustrée du texte, soit parce que la ou les comparaisons sont effectuées au moyen de plus dune seule mesure dépendante (pour la définition dune comparaison binaire, voir section 2.1).
Le tableau 2.2.1 indique pour lensemble des comparaisons binaires la nature de leffet principal, qui est fixé au seuil de signification de 5 % (alpha = 0,05):
Pour faciliter la lecture des tableaux-synthèses qui suivent,
les résultats bruts ont été traduits en pourcentage. En plus, un pourcentage
pondéré a été ajouté afin de pallier au déséquilibre entre les expériences quant
au nombre de comparaisons binaires. Le résultat non pondéré accorde en effet
un poids plus considérable aux expériences qui donnent lieu à plusieurs comparaisons
binaires. Le résultat pondéré permet de corriger cette inégalité en accordant
globalement le même poids à chacune des expériences dans le calcul global.
|
Tableau 2.2.1 |
|||||
|
ill > ni |
ni > ill |
non sig |
Total et % |
||
| Total | Non pondéré (score) Non pondéré (%) Pondéré (%) |
133 |
4 |
232 |
369 |
Cent trente-trois (133) des 369 comparaisons binaires signalent une supériorité significative de la version illustrée sur la version non illustrée en ce qui concerne la compréhension de texte (ill > ni). Dans quatre expériences, la supériorité inverse est significative (ni > ill), la présence de lillustration y étant identifiée comme élément dinterférence. Dans 232 comparaisons, finalement, la différence entre les versions illustrée et non illustrée est non significative (non sig ou ill = ni).
Une remarque dordre méthodologique simpose ici, remarque qui sera dailleurs tout aussi importante pour linterprétation correcte des autres tableaux-synthèses. En effet, les manuels en méthodologie de recherche expérimentale soulignent généralement lasymétrie qui existe entre les résultats significatifs et non significatifs en ce qui concerne leur interprétation. Lorsquune hypothèse savère significative, on est en droit daffirmer que la différence postulée existe réellement et nest pas simplement un artefact expérimental. Cette affirmation est relative au seuil de signification fixé davance, généralement de 5 %: laffirmation peut savérer fausse une fois sur vingt. Lorsquune hypothèse est non significative, par contre, le degré de certitude que labsence dune différence significative soit réelle nest pas aussi élevé. Souvent, la probabilité derreur liée au résultat est élevée au point de rendre dénuées de tout fondement les prévisions. Cest pourquoi lhypothèse nulle (i.e. absence dune différence significative) ne peut être confirmée, contrairement à lhypothèse alternative qui prévoit une telle différence. Labsence dune différence significative entre la version illustrée et la version non illustrée, dans une expérience donnée, ne doit donc jamais être interprétée comme preuve pour la non-existence dune telle différence. Plus prudemment, on dira que lexpérience en question ne permet pas de confirmer lhypothèse alternative, sachant que cette formulation nest pas synonyme avec laffirmation que lhypothèse nulle soit confirmée. La répétition dans les mêmes circonstances dune expérience dont le résultat est significatif devrait aboutir au même résultat, sauf dans 5 % des cas. La répétition dune expérience dont le résultat est non significatif, par contre, naboutit pas au même résultat non significatif avec une certitude analogue.
Comme conséquence directe de cette mise au point, il faut éviter de comparer de façon absolue le nombre de résultats significatifs et non significatifs. Dans une méta-analyse, par exemple, le nombre de résultats significatifs peut être de loin inférieur au nombre de résultats non significatifs tout en ayant un impact global significatif (pour plus de renseignements à ce sujet, voir par exemple Glass et al., 1981; Hedges et Olkin, 1980). Dans les tableaux-synthèses du présent ouvrage, le fait saillant réside dans la comparaison des résultats qui sont significatifs: ill > ni vs ni > ill.
Quon sappuie sur le pourcentage pondéré ou non pondéré, le tableau 2.2.1 souligne clairement la contribution positive de lillustration à la compréhension de texte: 133 comparaisons binaires indiquent une supériorité significative de la version illustrée sur la version non illustrée du même texte, comparativement à seulement quatre, qui indiquent le contraire.
Les études de Weintraub (1960), Popham (1969), Harber (1983) et Rose (1986) sont les seules à soutenir que lillustration exerce un effet néfaste sur la compréhension de texte. Ces quelques contre-exemples sont rares au point quil paraît justifié dexaminer de plus près leur méthodologie de recherche. Rappelons que dans les études du présent chapitre, lillustration est globalement compatible avec le texte, les études à support pictural délibérément incompatible étant traitées ailleurs (voir chap. 8).
Parmi les quatre études à contre-courant, la thèse de doctorat de Weintraub (1960) mérite une attention particulière puisque, dans les années 1970, elle a joué un rôle de premier plan dans le débat concernant lutilisation de lillustration dans lapprentissage des premiers mots écrits en lecture. Lexpérience de Weintraub a été menée en salle de classe afin quelle se rapproche le plus possible des conditions normales de lenseignement en classe. Ce souci d " écologie expérimentale " sest traduit par des moyens de soutien variés accordés à lécolier en cas de difficulté de lecture:
In giving directions for reading the stories and taking the tests, the writer, who worked directly with all the children in collecting the data, informed the subjects that any words not know might be asked of him or of the classroom teacher if she were in the room. (...) Prior to having the children read or look at a story, the writer introduced, by writing on the board, the names of characters to be found in the story and many nouns and other words which might have been new to most of the children. Many times a slight introduction to the story was given also (Weintraub, 1960, p. 31-32).
Si louable que puisse paraître une telle démarche sur le plan pédagogique, il reste quelle diminue substantiellement la validité interne de lexpérience. Comme on fournit aux lecteurs une aide supplémentaire en cas de difficulté, lillustration risque de perdre dans lexpérience sa raison dêtre, celle de soutien à la compréhension du texte. Expérimentalement parlant, cette aide supplémentaire constitue en fait une variable parasite, non contrôlée, qui bénéficie aux lecteurs dans le traitement texte non illustré. Les lecteurs peuvent compenser pour labsence de lillustration par les questions quils peuvent adresser aux personnes-ressources. Dans le même ordre didée, il est dailleurs fort révélateur que les lecteurs faibles, comme le rapporte lauteur, se servent le plus de laide offerte (" It was noted that the poorer readers asked for a great many more words ", Weintraub, 1960, p. 32). Cest en effet ces mêmes lecteurs qui performent le mieux en absence de lillustration, comparativement à la condition expérimentale illustrée. Il semble aussi que la supériorité significative des lecteurs de la version non illustrée soit favorisée par la nature du posttest: ses items ont été dûment sélectionnés de façon à porter uniquement sur les informations non illustrées (voir Note du résumé de létude).
Signalons le parallélisme entre les études de Weintraub (1960) et de Samuels (1967) concernant le soutien fourni aux lecteurs et les résultats auxquels elles mènent. Dans Samuels (1967), des enfants de première année du primaire ont appris des mots, présentés hors contexte, avec ou sans lillustration. En phase dapprentissage, laide a été fournie aux enfants en cas de difficulté. (Le terme rétroaction, utilisé par Samuels, nous paraît inapproprié puisque laide fournie aux enfants représente en réalité le stimulus crucial sans lequel il ny aurait pas eu dapprentissage, dans le cas du groupe sans illustrations.) Comme dans lexpérience de Weintraub (1960), cette aide a pu surtout être bénéfique aux enfants dépourvus dillustrations, et en particulier aux lecteurs débutants faibles. Le degré dapprentissage des enfants qui a été vérifié au moyen dun posttest non illustré (liste de mots) en témoigne. Dans lexpérience de Samuels comme dans celle de Weintraub, le fait que les lecteurs soient aidés dans leur tâche constitue une variable parasite significative dont leffet à elle seule, quoique confondu avec le traitement expérimental, explique la supériorité de la version non illustrée. La méthodologie de Samuels (1967) a été critiquée par plusieurs (p. ex. Montare, Elman et Cohen, 1977; Arlin, Scott et Webster, 1978, Arlin, 1980). Comme nous croyons, lessentiel de cette critique sapplique également à létude de Weintraub (1960) même si, dans ce cas, la dépendance des enfants de laide fournie par les personnes-ressources nétait que partielle, vu la présence du contexte linguistique que procure le texte.
Dans Harber (1983), une autre étude ayant observé un effet pictural négatif, le résultat se présente sous forme dinteraction aptitude x traitement. Ainsi, les enfants identifiés comme ayant des difficultés dapprentissage réussissent significativement mieux après la lecture de la version non illustrée des textes, tandis que les enfants issus de classes dites normales réussissent significativement mieux après la lecture de la version illustrée. Si intéressant qu'un tel résultat dinteraction puisse paraître, il faut mentionner que les textes de lecture présentés aux deux populations ne sont que partiellement les mêmes. Ce manque déquivalence diminue la validité interne de lexpérience puisque l'interaction observée dans l'étude pourrait bien être attribuable au manque de contrôle expérimental du matériel picto-verbal plutôt quà labsence ou à la présence de lillustration, les deux variations étant confondues. Aussi, l'auteur semble avoir utilisé intégralement le matériel de lecture et d'évaluation du Gray Oral Reading Test, matériel dont la pertinence à des fins danalyse picto-verbale paraît discutable. À linstar de Harber (1983), Rose (1986) utilise un manuel de lecture déjà existant pour en extraire les textes et, en partie, les questions de compréhension administrées au posttest. Aussi, les renseignements fournis dans cet article sont nettement insuffisants pour quon puisse se faire une idée précise de la nature du matériel de lecture et dévaluation. La portée réelle des résultats expérimentaux de Popham (1969) nous paraît également discutable, deux des trois comparaisons illustré - non illustré étant non significatives, dont une manifestant une supériorité tendencielle inverse.
En résumé, les expériences répertoriées au tableau 2.2 confirment clairement lhypothèse voulant que la présence de lillustration exerce un effet positif sur la compréhension de texte.
Dans les sections 2.2.2 - 2.2.8, nous examinerons ce résultat à la lumière de certaines caractéristiques des expériences (sujets, matériel expérimental, etc.), caractéristiques qui ne sont pas elles-mêmes des variables indépendantes. Des méta-analyses font souvent intervenir de telles informations. Lâge des sujets par exemple, puisquil risque de varier dune étude à lautre, fait partie de ces paramètres susceptibles dinteragir avec la variable picturale dintérêt dans ce chapitre, i.e. la présence et labsence de lillustration. Sept paramètres qui, répétons-le, nont pas eux-mêmes le statut dune variable indépendante dans les expériences concernées ont été identifiées (voir le chapitre 3 pour lanalyse des interactions entre variables).
Quelle est la pertinence dune synthèse des résultats inter-études en fonction de paramètres qui ne sont pas eux-mêmes des variables? Nest-il pas préférable de restreindre lanalyse des interactions possibles aux variables identifiées comme telles dans les expériences? En fait, nous croyons que les deux types de synthèse sont valables et quils peuvent servir de sources de renseignements complémentaires, puisque chacun a des points forts et des points faibles. Le premier type de synthèse (cf. chap. 2.2.2 - 2.2.8) permet de tenir compte du plus grand nombre détudes possible, ce qui augmente la représentativité des conclusions. Par contre, puisque la variable picturale est étudiée à la lumière dun paramètre qui ne varie que dune étude à lautre (une " variable " inter-études, en quelque sorte), leffet de ce paramètre risque dêtre confondu avec leffet dautres paramètres, à moins quun contrôle statistique des paramètres par des moyens appropriés soit possible. Malheureusement, plusieurs des paramètres nétant pas spécifiés dans toutes les expériences, la tentative détudier la contribution relative de chaque paramètre au moyen dune régression multiple a dû être abandonnée: trop dexpériences auraient dû être exclues. Le deuxième type de synthèse (cf. chap. 3) permet détudier linteraction de deux variables issues de la même expérience, ce qui garantit la validité interne des résultats et des conclusions qui en résultent. Par contre, le nombre détudes sur lesquelles une telle synthèse peut sappuyer est nettement plus limité.
Essayons dillustrer les deux options à laide dun exemple. Selon une hypothèse dinteraction bien connue, le mode dappréhension du texte par les sujets (lecture vs écoute) interagirait avec lillustration (présence vs absence). Leffet positif de lillustration sur la compréhension du texte en situation découte serait supérieur à celui en situation de lecture. La logique sous-jacente dune telle hypothèse dinteraction veut que la perception auditive du texte et la perception visuelle de lillustration aient un plus grand effet facilitateur sur lemmagasinage et le traitement de linformation picto-verbale que la perception uni-modale qui prévaut en situation de lecture. La vérification expérimentale dune telle hypothèse dinteraction se fait généralement au moyen dun plan expérimental qui croise les deux variables dintérêt (2 x 2). La manipulation expérimentale des variables simpose si lon veut maximiser la validité interne des résultats. Par contre, le nombre restreint des études permettant lanalyse de ce type dinteraction risque de limiter les généralisations possibles. Devant ce dilemme, une démarche complémentaire consiste à comparer lensemble des études dans lesquelles les sujets lisent des textes en présence ou en absence de lillustration avec celles dans lesquelles les sujets écoutent des textes en présence ou en absence de lillustration. Lavantage principal dune telle synthèse réside dans la diversité échantillonnale des études, une diversité favorisant la généralisation des résultats au-delà de lexpérience individuelle et donc permettant la découverte de tendances générales applicables à des situations variées. Son point faible est toutefois, rappelons-le, son manque de contrôle des variables parasites, avec tous les impondérables que cela entraîne. Les tendances générales dégagées aux tableaux-synthèses 2.2.2 - 2.2.8 doivent être interprétées en conséquence.