Petit guide pratique pour faciliter l'interrogation des corpus sous TACT (Usebase) et TACTweb

par Emilie Devriendt

Version légèrement remaniée d'une intervention faite dans le cadre des Journées d'étude consacrées aux Nouvelles Technologies de l'Information et de la Communication, Maison des Sciences de l'homme et de la Société, Poitiers (3-5 mai 2001).

Emilie Devriendt


Sommaire

1. En guise d'introduction : Memoranda

1.1. TACT, Usebase, et TACTweb.
1.2. Préparation et balisage des corpus (Résumé)

2. Outils et modes d'interrogation

2.1. Les expressions régulières utiles pour l'interrogation sous Usebase et TACTweb (Requêtes simples et "filtrées")
2.2. Les opérateurs booléens utiles pour raffiner (filtrer) les requêtes

3. Une fonction d'interrogation "tactique" fort utile : GROUP (Usebase)

3.1. Utilité de la constitution des groupes.
3.2. Caractéristiques de la fonction GROUP
3.3. Constitution et affichage d'un groupe (mode d'emploi)
3.4. Effectuer une requête portant sur un ou plusieurs groupe(s).

4. A poursuivre...


1. En guise d'introduction : Memoranda

1.1. Text Analysis Computing Tools.

Il sera ici question, essentiellement, de l'interrogation de bases TACTweb et de bases TACT.

Dans la mesure où TACT, logiciel off-line, comprend 16 programmes différents, nous n'évoquerons que le programme USEBASE (appelé TACT dans la précédente version du logiciel), outil standard d'analyse textuelle. TACTweb constitue l'interface Web du programme USEBASE. Les bases TACTweb peuvent donc être interrogées selon les mêmes modalités que les bases TACT (à quelques exceptions près, sur lesquelles on reviendra).

1.2. Memo destiné aux utilisateurs de TACT off-line : Les phases de préparation et de balisage du corpus.

Les quelques indications qui suivent se veulent sommaires. On consultera l'article de Russon Wooldridge pour plus de précisions.

2. Outils et modes d'interrogation

Nota :

2.1. Expressions régulières et filtres utiles pour interroger Usebase et TACTweb (requêtes simples et "filtrées")

Recherche de formes simples
SymboleFonctionExemple
. n'importe quelle lettre narr.
[..] l'une ou l'autre des lettres figurant dans les crochets narr[ée].
: de X à Y (par ordre alphabétique) nar[a:q].
[~..]n'importe quelle lettre SAUF celle(s) qui figure(nt) entre les crochets narr.*[~s]
* 0 ou plus des lettres précédant ce caractère (Nota : .* joker) narr.*
Recherche de plusieurs formes conjointes
, liste qualité, nature
& cooccurrence nature & qualité
qualité & nature
~ exclusion (sous TACTweb) qualité ~ nature
- exclusion (sous TACT)
| lexies (collocats) ou syntagmes fixes nature | d.
la |> nature | d.
>| recherche en fonction de la place par rapport à la forme pivot>| la | nature | d.
la | nature | d. |>

2.2. Les opérateurs booléens utiles pour raffiner (filtrer) les requêtes

Nota: La forme d'une requête complexe est de type "SOURCE ; FILTRE". L'usage du point-virgule est nécessaire pour indiquer le ou les filtre(s) choisi(s).

FREQ permet l'affichage des formes en fonction de leur fréquence dans le texte .*tion ; freq >=10
freq >=54
WHEN permet de raffiner la requête en fonction de la valeur des balises nature.* ; when division=D1
distribution voix D1
distribution voix D2
SIMIL affiche les mots en fonction de leur similarité orthographique avec le pivot simil narration 70%
.*tion;simil narration 70%
SPAN affiche les mots figurant dans le contexte sélectionné de la forme pivotnature ; span

3. Une fonction d'interrogation "tactique" fort utile: GROUP.

3.1. Utilité de la constitution des groupes.

GROUP est une fonction de Usebase qui n'est pas disponible pour l'interrogation des bases TACTweb. Elle est particulièrement utile pour effectuer certains types d'analyses.

3.2. Caractéristiques de la fonction GROUP

Pour constituer un groupe, on sélectionne tout d'abord une liste de mots, qui peut être:

Une fois la liste de base sélectionnée, on peut retenir ou exclure les mots voulus pour former le groupe définitif. Bien sûr, on peut aussi constituer un groupe à partir d'autres groupes préalablement constitués.

3.3. Constitution et affichage d'un groupe (mode d'emploi)

Pour afficher un groupe donné:

3.4. Effectuer une requête portant sur un ou plusieurs groupe(s).

Le principe est le même que celui d'une requête simple. On peut utiliser les mêmes outils de raffinement (opérateurs).

Pour désigner le groupe dans la ligne de requête, on tape @ suivi du nom du groupe. Exemple ici: @nature, @artif.

4. A poursuivre...

Bien entendu, l'exposé qui précède ne se veut ABSOLUMENT PAS exhaustif ! TACT présente un grand nombre de fonctionnalités qui méritent d'être expérimentées dans le cadre d'une recherche précise effectuée sur un corpus donné (une base ou plusieurs bases TACT simultanément). Rappelons-le, il comporte en tout 16 "outils", dont Usebase et Makebase. Enfin, sous Usebase seulement, comme on espère l'avoir suggéré ici, les modalités d'interrogation peuvent être considérablement variées. Qu'on se le dise !