Textopol > Enseignement > Séminaire doctoral >

Programme des séances -Archives 2005 - 2006

 
Les programmes détaillés de chaque journée seront mis à jour régulièrement, les exercices réalisés mis en ligne d'une fois sur l'autre afin que chacun puisse, si besoin est, s'y référer.
             
>> Séance 1:  
- 19 novembre 2005 -
 
  En ligne
>> Séance 2:  
- 17 décembre 2005 -
 
  En ligne
>> Séance 3:  
- 21 janvier 2006 -
 
  En ligne
>> Séance 4:  
- 18 février 2006 -
 
  En ligne
>> Séance 5:  
- 11 mars 2006 -
 
  En ligne
>> Séance 6:  
- 08 avril 2006 -
 
  Séance annulée
>> Séance 7:  
- 06 mai 2006 -
 
  En ligne
>> Séance 8:  

- 27 mai 2006 -

 
  En ligne
             

     
>>
Séance 1
 

Programme:

 

Informatique textuelle
Séance 1, samedi 19 novembre 2005 à 9h30, CMC 227


9h30-12h30

1. Objectifs et moyens du séminaire : le recherche textuelle informatisée ; espace de travail ; accès ; modes de travail, calendrier, évaluation.

2. Les outils de la recherche: site Textopol ; logiciels et bases de données. Visite de CORDIAL et HYPERBASE.

3. Cours d’informatique textuelle (1) : Un exemple de Traitements automatisés de discours politiques : les vœux présidentiels (JM Leblanc).

14h-16h

4. Exercices
- Constitution (recueil et préparation) d’un corpus test : Le discours syndical
- Traitement du corpus-test par CORDIAL
- Traitement du corpus-test par HYPERBASE


Documents:

• Instructions pour le recueil et la constitution de corpus lexicométriques (PDF) (HTML)
• Exercice 1.1 : Recueil, et traitements du corpus test : CFDT72-92

 


>>
Séance 2

Programme:

 

Informatique textuelle
Séance 2, samedi 17 décembre 2005 à 9h30, CMC 227

Thème de la séance : Traitement d'un corpus graphique ou catégorisé

9h30-11h

1. Rappels

- Espaces de travail et profils ;
- Principes et objectifs du traitement automatisé de discours: quantification, étiquetage
- L’approche CORDIAL



2. Prise en main d’HYPERBASE : traitement du corpus lexicométrique non catégorisé Vœux présidentiels (locuteur, date).

11h15-12h30


3. Cours de lexicométrie

- La démarche lexicométrique ; hypothèses et variables ; constitution de corpus et partition ; tableau lexical complet et partiel ; propriétés statistiques vs propriétés linguistiques ; protocoles de description.
- Résultats et interprétions : présentation et discussion d’un ouvrage récent utilisant HYPERBASE et CORDIAL (Mayaffre, 2004).


Verre de l’amitié pour fêter la thèse de Jean-Marc Leblanc

14h-16h30

4. Traitement de la base catégorisée Vœux présidentiels HYPERBASE,

5. Travail sur les corpus personnels.


Documents:

 

• Exercice 2.1 : Traitement Hyperbase du corpus vœux présidentiels
• Exercice 2.2 : Examiner la distribution des auxiliaires de modalité ( pouvoir, devoir, etc.) dans le corpus voeux

 


>>
Séance 3

Programme:

 

Informatique textuelle
Séance 3, samedi 21 janvier 2006 à 9h30, CMC 227


9h30-11h

A. Salem (professeur à Paris 3) : La lexicométrie, types génériques,
cartographies et genres textuels.

11h30-12h30

- Prise en main de Lexico 3 ( Corpus test : résolutions générales CFDT-CGT :
1970 -1992)

13h30-16h

- Prise en main de Lexico 3 (suite)
- Traitement des corpus personnels.


Documents:

 

• Exposé de synthèse - André Salem : Télécharger le diaporama

• Exercice 3.1 : Prise en main de Lexico 3 en cinq étapes - Corpus voeux présidentiels. (PDF)
• Plan des cinq étapes (PDF)

 

 

 


>>
Séance 4

Programme:

 

Informatique textuelle
Séance 4, samedi 18 février 2006 - 9h30, CMC 227

9h30-11h

Analyses de discours, lexicométrie et textométrie, analyse de contenu assistée par ordinateur : autour du logiciel Tropes. Présentation des fonctionnalités du logiciel Récupération de données, indexation de données textuelles, analyse du contenu textuel.

11h15-12h30

- Prise en main de Tropes (version restreinte) à travers un exercice de description du corpus des élections présidentielles américaines (Débat Bush-Kerry, novembre 2004).


13h30 - 16h

- Comparaison des résultats Tropes et Cordial sur le corpus Bush- Kerry 2004
- Examen d’une recherche argumentative réalisée à l’aide de Tropes : Trébucq, Mots 2005
- Suite des travaux personnels

 

 

Documents:

• Prise en main de Tropes sur le corpus Busk-Kerry (PDF) (HTML)
• Corpus de travail : Bush 1, Kerry 1

• Corpus "voeux 2006":

- Chirac, voeux aux Français (décembre 2005),
- Chirac voeux à la presse (janvier 2006)
- Villepin, voeux à la presse (janvier 2006)
- Sarkozy, voeux à la presse (janvier 2006)

 


>>
Séance 5

Programme:

 

Informatique textuelle
Séance 5, samedi 11 mars 2006 - 9h30, CMC 227

9h30-12h30

1. La méthodologie Alceste.
- Distributions statistiques et distribution linguistique
- Cooccurrences et univers lexicaux
- UCI, UCE, Mots étoilés
- Résultats et interprétations : un exemple

2. Prise en main d'Alceste
- Exercice de conversion du corpus Bush- Kerry de Lexico vers Alceste.
- Analyse du corpus BK6 sous Alceste :
Les classes sémantico-thématiques du corpus, les U.C.E caractéristiques.



13h30-16h30

3. Applications avancées d’ALCESTE sur le corpus voeux

4. Passage Alceste sur les corpus des participants.

 

 

Documents :


• Exercice 5.1 : Conversion du corpus BK Lexico, vers Alceste (PDF), (HTML)
• Corpus de travail balisage lexico: Base dynamique
• Bush Kerry balisé pour Alceste : Base dynamique


 

 

 


>>
Séance 6

Programme:

 

La séance 6 consacrée à Weblex
est annulée et reportée au samedi 27 mai 2006 - 9h30, CMC 227/342


 

 


>>
Séance 7

 

Programme:

 

Informatique textuelle
Séance 7, samedi 06 mai 2006 - 9h30, CMC 227

Exploration textométrique de corpus multilingues


9h30-10h00


Travaux des participants en cours ou achevés ; point sur l’évaluation.

10h - 12h30


Exposé de Maria Zimina-Poirot Postdoc, (EA 2290 SYLED, Université Sorbonne Nouvelle Paris 3)-
Exercices: alignements des textes et repérages des unités lexicales

13h30 - 16h


-Comparaison et traitement du corpus multilingue Bush-Kerry
- Suite des travaux personnels




Documents:

 

Exercices :

  • 7.1 : Analyse de corpus de textes juridiques (français/anglais) à l'aide d'outils de statistique textuelle - Lexico3. (Maria Zimina-Poirot).
  • 7.2 : Analyse et comparaison du corpus Bush-Kerry multilingue

 

 

>>
Séance 8



Programme:

 

Informatique textuelle
Séance 8
samedi 27 mai 2006 - 9h30, CMC 227/342

 

9h30-10h15

1. Présentation de travaux des participants

2. Traitements lexicométriques et cooccurrences (autour de Weblex)

- Rappel des étapes du cours (JML)
- Cooccurrences et cooccurrenceurs :Notion générale, quatre exemples (PF).

Contextes et tris croisés dans Frantext
Cooccurrences dans les énoncés élémentaires (Alceste)
Cooccurrences spécifiques (Lexico3)
WEBLEX : des cooccurrences généralisées aux lexicogrammes.

- Les fonction documentaires
- Les fonctions statistiques
- Les fonctions cooccurrentielles (Lexicogrammes simples et récursifs)

10h15-11h15

3. Prise en main de WEBLEX. autour du corpus voeux (JML)

- Exercice 8.1 : L'examen de la forme Monde, lexicogrammes, répartition, spécificités.

Pause



11h30-13h00

4. Navigation textométrique : Prise en main du langage CQP de WEBLEX. (PF et JML)

Exercice 8.2 : Exploration des différentes couches d’un corpus, en surface (forme graphique) ou sur les catégories morpho-syntaxiques.


- Le catégoriseur Cordial et son utilisation dans Weblex
- La recherche de motifs (formes graphiques ou catégories).

14h-16h30

Fin des exercices et travaux personnels

 

Documents:

• Exercice 8.1 : Monde dans les voeux présidentiels : les lexicogrammes récursifs. (PDF)
• Exercice 8.2 : Recherche de motifs sous weblex (PDF)


• Document : Jeu d'étiquettes utilisé sur le corpus voeux pour Weblex (PDF)

 


Deux liens distincts vers le serveur Weblex:


http://weblex.ens-lsh.fr/wlx/
http://lexico.ens-lsh.fr/local/lexploreur.html

 

 


>>Navigation:      
>>

INFORMATIONS et INSCRIPTIONS: fiala@univ-paris12.fr