FRE 335H5
Teaching and Learning French with New Technology

Section LEC0101

2009-2010

Notes de la semaine 5
Évaluation des ressources en ligne

L'imprimé et l'électronique

L'évaluation des livres et revues que l'on trouve à la bibliothèque se fait depuis des siècles. Un livre ne change pas : il est publié dans telle ville, par tel éditeur, à telle date. Si l'auteur ou l'éditeur veulent changer le contenu du livre, ils publient une deuxième édition portant une autre date ; la première édition reste inchangée. L'objet imprimé et publié a donc un statut fixe. Les services bibliothécaires offrent au lecteur une expertise séculaire. Les études critiques sont nombreuses et connues ; certaines, traitant de larges corpus, sont regroupées dans une salle de référence.

L'évaluation des ressources électroniques diffusées en ligne dans le World Wide Web ne date que de quelques années ; elle est très partielle et peut à tout moment disparaître de vue si la métaressource est retirée du Web. Les ressources en ligne sont de nature dynamique, et non statique, en ce que l'auteur de telle ou telle ressource peut à tout moment en changer le contenu ou la forme, sans nécessairement le signaler. Certaines ressources portent la mention de la date de première publication et les dates des mises à jour – mais cette pratique est loin d'être universelle.

Les métasites

Il y a essentiellement deux types de métasites.

• 1. Les sites portails. Les sites portails, comme Le Point du FLE, WebLettres ou Tennessee Bob's Famous French Links, qui essaient de couvrir tout le terrain du domaine qu'ils ont choisi (comme la langue, littérature et culture francophones) en classant les ressources pertinentes du Web dans des catégories particulières et en donnant un hyperlien vers chacune des ressources recensées. C'est un travail sisyphéen : comme Sisyphe, qui était condamné par les dieux d'Olympe à rouler éternellement jusqu'au sommet d'une colline une pierre qui chaque fois redescendait jusqu'en bas, l'auteur d'un site portail n'a jamais fini son travail de recensement. Alors que la littérature française du XVIe siècle est fixe, la littérature française en ligne bouge chaque jour. Comme la Toile est dynamique, les pages apparaissent et disparaissent, de sorte que les ressources thématiques des sites portails sont typiquement incomplètes ou bien contiennent des liens morts.

• 2. Les sites critères. Plutôt que de se contenter de ce que les sites portails ont à offrir, on préférera souvent se fier aux résultats, plus à jour, d'un moteur de recherche comme Google. Dans ce cas, on a quand même besoin de critères pour juger de la fiabilité de ce qu'on trouve dans le Web. D'où des sites critères comme SAPRISTI! "Sentiers d'Accès et des Pistes de Recherche d'Informations Scientifiques et Techniques sur Internet" (INSA, Lyon), "Évaluation critique des ressources sur l'Internet" (Université de l'Alberta), "Comment évaluer de manière critique les ressources issues de l'Internet?" (Commission "Français et Informatique" de la Fédération de l'enseignement secondaire catholique belge) ou ACRE "pour une autonomisation de la critique de ressources en ligne" (Université de Toronto).

En faisant une synthèse des diverses grilles d'évaluation proposées par les différents sites critères, on peut dire que les questions essentielles auxquelles on doit essayer de trouver des réponses critiques sont

Qui? = Qui est l'auteur de la ressource?

L'identification de l'auteur – individu, groupe ou organisme – est un élément important dans la validation d'une ressource. Il y a plusieurs endroits où chercher l'auteur, dont : le titre hors cadre affiché tout en haut à gauche du navigateur ; l'adresse Web (URL) affiché dans la case hors cadre pourvue à cet effet par le navigateur ; dans le texte affiché dans le cadre généralement soit en haut, soit en bas ; sur la page "Présentation du site" (ou équivalent, tel "About Us") signalée dans le menu de la page d'accueil.

Dans le premier exemple qui suit, l'auteur, Statistique Canada, agence du gouvernement fédéral, est indiqué dans l'adresse Web (statcan.ca) et dans le logo en haut de la page.

Dans l'exemple suivant, l'identité de l'auteur n'est indiquée dans l'adresse Web que par .be *, qui signale qu'il est belge, alors que le reste de l'adresse (users.skynet) nous dit simplement qu'il s'agit d'un serveur général accueillant toutes sortes de sites, associatifs ou personnels. L'auteur serait une Commission appelée "Français et informatique" appartenant à "la FESeC" – on trouve ces informations dans le texte. L'endroit logique pour chercher à savoir ce que c'est que la FESeC belge, ce serait la page "Page d'entrée du site" indiquée dans le menu à gauche. C'est effectivement cette page qui signale que la FESeC est la Fédération de l'enseignement secondaire catholique belge. (* .be = site belge, .ca = site canadien, .fr = site français, .ch = site suisse.) Dans le troisième exemple, donné ci-dessous, l'identité de l'auteur est indiquée par l'adresse Web (uottawa.ca) – il s'agit d'un membre ou de membres de l'Université d'Ottawa – et peut-être plus en détail sur la page "Présentation".

Pour qui? = À qui la ressource est-elle destinée?

La question est peut-être moins importante que la précédente, puisqu'on sait très bien, par exemple : qu'un journal s'adresse à tous ceux qui ont l'habitude de lire le journal, c'est-à-dire en principe tout le monde ; qu'un site offrant les Fables de La Fontaine s'adresse à tous ceux qui aiment les fables ou La Fontaine ou la littérature pour jeunes ; qu'un site offrant les paroles de chansons francophones s'adresse aux personnes aimant la chanson francophone. C'est-à-dire que dans beaucoup de cas la réponse est évidente.

Dans l'exemple suivant, la ressource belge "Comment évaluer de manière critique les ressources issues de l'Internet?" s'adresserait à tous ceux qui s'intéressent à la question, qu'ils soient belges ou non, mais le texte nous révèle que cette ressource a été conçue en particulier pour "les élèves de l'enseignement secondaire". Ce qui nous dit que le public visé par l'auteur ne correspond pas nécessairement au public effectif.

Le deuxième exemple, pris sur le site grammatical Weboscope de l'Université de Louvain en Belgique, nous montre que son contenu s'adresse à différents niveaux d'enseignement du français.

Quoi? = Quel est le contenu de la ressource?

Le plus souvent, le contenu est évident d'après le titre de la ressource, donnée dans le titre du navigateur ou en haut du texte de la page d'accueil. Une autre façon de s'informer sur le contenu exact de la ressource est d'ouvrir la page "Plan du site" lorsqu'elle existe.

Dans l'exemple suivant, la page d'accueil semble ambiguë. "ABC de la Chanson Francophone" offre-t-il musique chantée et paroles des chansons? L'adresse – www.paroles.net – ainsi que la présence seulement occasionnelle du symbole nous suggère qu'il ne s'agit essentiellement que de paroles.

Dans le deuxième exemple, la page d'accueil nous signale plusieurs contenus, dont le principal serait les Fables de La Fontaine. Mais il y a aussi une biographie de "L'auteur" (c.-à-d. La Fontaine) et un "Livre d'or", où les visiteurs notent leur nom et leur commentaires.

Quand? = a) Quand la ressource a-t-elle été publiée? b) Quand la ressource a-t-elle été consultée?

La différence est importante.

• Pour certaines ressources la date de publication est importante, pour d'autres elle est indifférente. L'ensemble des ressources d'un journal en ligne est soit versé dans l'actualité du numéro du jour de consultation, soit dans les archives du journal lorsque les articles appartiennent au passé ; la différence est donc importante. Pour une ressource contenant les Fables de La Fontaine, la date de publication est indifférente, puisque le contenu reste le même depuis que La Fontaine a écrit ses fables au XVIIe siècle. Ce sont là des cas extrêmes. Entre les deux se trouvent des ressources comme : a) les sites portails, qui en principe doivent se mettre à jour régulièrment ; ou b) Wikipédia, une encyclopédie-dictionnaire en ligne qui invite ses contributeurs à la maintenir à jour.

Wikipédia : le passé

La notice sur Zola est comme les Fables de La Fontaine : l'information est statique et ne nécessite ni une indication de la date de publication, ni des remises à jour.

Wikipédia : le présent large

En juin 2006 on pouvait lire dans Widipédia au mot peopleisation :

Le mot était nouveau et d'usage restreint (le 5 juin 2006 les pages francophones de Google signalaient 590 documents contenant une occurrence du mot pipolisation). En janvier 2007, l'emploi du mot était devenu fréquent (pipolisation x 14 400, peopolisation x 55 900 au 30 janvier 2007). L'article de Wikipédia avait également changé :

En octobre 2009, le mot est courant et, par conséquent, l'article de Wikipédia est plus étoffé :

Wikipedia : le présent immédiat

Extrait d'un article consulté à 21h10 le 9 février 2009 quelques minutes après l'événement décrit :

• La date de consultation. Dans toute étude de ressources en ligne, il est important de citer la date de consultation. Alors que dans une bibliographie pour les sources publiées sur papier il est d'usage de citer la date de publication (source fixe), pour les sources en ligne il est bien plus informatif et plus correct de citer la date de consultation (source instable) : quand on cite un article de Wikipédia, par exemple, la date de consultation fixe le moment où la source disait la chose citée, tandis que le lecteur de l'étude peut trouver autre chose dans Wikipédia au moment de la lecture.

Par exemple (exemples fictifs) :

Comment? = Comment la ressource est-elle articulée, comment est-elle présentée?

1. L'articulation. C'est le niveau supérieur ou macrotextuel de la ressource. Il s'agit essentiellement de la navigation d'une partie à une autre d'une ressource. Normalement la page d'accueil donne des hyperliens, soit dans un menu, soit dans le corps du texte, vers des pages particulières traitant de tel ou tel aspect de l'ensemble, que ce soit des articles de journal, des exercices sur tel ou tel point de grammaire, des paroles de telle ou telle chanson, du détail de tel ou tel critère d'évaluation, des oeuvres en ligne de tel ou tel auteur, etc. Certaines ressources offrent un "Plan du site", qui contient des hyperliens vers toutes les pages.

On dira que dans l'exemple suivant la navigation est bonne en ce qu'elle permet d'aller directement de la version française d'une page à la page correspondante en anglais.

En revanche, l'exemple suivant, pris sur un autre site du gouvernement fédéral canadien, montre une mauvaise navigation : 2. La présentation. Au niveau microtextuel, on doit évaluer la lisibilité de la page. La couleur du texte se démarque-t-elle bien de la couleur de fond? Les mots sont-ils correctement espacés? Y a-t-il des "veuves" ou des "orphelins" (caractères de ponctuation qui doivent normalement être rattachés au texte qui suit ou au texte précédent)? Dans le métier séculier d'imprimeur, il n'y a pas de veuves ou d'orphelins. Cependant, n'importe qui peut publier en ligne et nombre d'outils de création de pages Web sont mal adaptés. Ainsi, par exemple, l'espace dur qui suit en français les guillemets ouvrants ou qui précède les guillemets fermants (comme dans « comment ») devient un espace mou lors de la conversion d'un document de traitement de texte en document Web. Cela donne, par exemple, dans le prestigieux Monde diplomatique en ligne : On trouvera d'autres exemples de défauts de présentation (plus des commentaires sur Qui? Pour qui? et Quoi?) dans l'article modèle "Maupassant en ligne: un regard critique", contenu dans ACRE (cf. ci-dessous).

3. La mise en forme. Encore au niveau microtextuel, on doit être conscient de la possibilité d'interroger la page. Une page se lit et/ou se consulte. La consultation d'une page web vient de la possibilité, donnée par la fonction "Trouver"/"Find", de trouver dans la page toute occurrence d'une chaîne de caractères : par exemple, la recherche dans la page présente de la chaîne "éval" révèlera progressivement les mots évaluation, évaluer... plus la chaîne éval contenue dans ce paragraphe !

Un document mis en forme dans le langage HTML ("hypertext markup language"), qui est le langage de base du Web, est toujours interrogeable. Les documents au format PDF ("portable document format") sont tantôt interrogeables (mode texte), tantôt non (mode image).

Un exemple d'une ressource qui comprend documents en mode texte et d'autres en mode image est Gallica, collection de textes informatisés (on dit en France "numérisés" et Gallica appelle sa collection "la bibliothèque numérique") et mis en ligne par la Bibliothèque nationale de France. La variété de formats peut être illustrée par une liste fournie par Gallica :

Un exemple d'un texte de Gallica en mode image, donc non interrogeable, est le roman Germinal d'Émile Zola :


Webographie

• "ACRE : Appréciation Critique de Ressources En-ligne", dans le Net des Études françaises (Université de Toronto), http://www.etudes-francaises.net/acre/. Ressource créée en 2000 et augmentée depuis.

• Russon Wooldridge, "Temporalité des contenus du Web", in Astrolabe (Université d'Ottawa), http://www.uottawa.ca/academic/arts/astrolabe/articles/art0042.htm, 2003.

Id., "La Typographie du Web", in Astrolabe, http://www.uottawa.ca/academic/arts/astrolabe/articles/art0046/Typographie.htm, 2004.