Textopol > Enseignement > Séminaire doctoral >
Programme des séances -Archives 2005 - 2006
Les programmes détaillés de chaque journée seront mis à jour régulièrement, les exercices réalisés mis en ligne d'une fois sur l'autre afin que chacun puisse, si besoin est, s'y référer.
>> Séance 1: - 19 novembre 2005 -En ligne >> Séance 2: - 17 décembre 2005 -En ligne >> Séance 3: - 21 janvier 2006 -En ligne >> Séance 4: - 18 février 2006 -En ligne >> Séance 5: - 11 mars 2006 -En ligne >> Séance 6: - 08 avril 2006 -Séance annulée >> Séance 7: - 06 mai 2006 -En ligne >> Séance 8: - 27 mai 2006 -
En ligne
Informatique textuelle
Séance 1, samedi 19 novembre 2005 à 9h30, CMC 227
9h30-12h301. Objectifs et moyens du séminaire : le recherche textuelle informatisée ; espace de travail ; accès ; modes de travail, calendrier, évaluation.
2. Les outils de la recherche: site Textopol ; logiciels et bases de données. Visite de CORDIAL et HYPERBASE.
3. Cours d’informatique textuelle (1) : Un exemple de Traitements automatisés de discours politiques : les vœux présidentiels (JM Leblanc).14h-16h
4. Exercices
- Constitution (recueil et préparation) d’un corpus test : Le discours syndical
- Traitement du corpus-test par CORDIAL
- Traitement du corpus-test par HYPERBASE
Documents:
• Instructions pour le recueil et la constitution de corpus lexicométriques (PDF) (HTML)
• Exercice 1.1 : Recueil, et traitements du corpus test : CFDT72-92
>> Séance 2
Informatique textuelle
Séance 2, samedi 17 décembre 2005 à 9h30, CMC 227
Thème de la séance : Traitement d'un corpus graphique ou catégorisé9h30-11h
1. Rappels- Espaces de travail et profils ;
- Principes et objectifs du traitement automatisé de discours: quantification, étiquetage
- L’approche CORDIAL
2. Prise en main d’HYPERBASE : traitement du corpus lexicométrique non catégorisé Vœux présidentiels (locuteur, date).
11h15-12h30
3. Cours de lexicométrie- La démarche lexicométrique ; hypothèses et variables ; constitution de corpus et partition ; tableau lexical complet et partiel ; propriétés statistiques vs propriétés linguistiques ; protocoles de description.
- Résultats et interprétions : présentation et discussion d’un ouvrage récent utilisant HYPERBASE et CORDIAL (Mayaffre, 2004).
Verre de l’amitié pour fêter la thèse de Jean-Marc Leblanc14h-16h30
4. Traitement de la base catégorisée Vœux présidentiels HYPERBASE,5. Travail sur les corpus personnels.
Documents:
• Exercice 2.1 : Traitement Hyperbase du corpus vœux présidentiels
• Exercice 2.2 : Examiner la distribution des auxiliaires de modalité ( pouvoir, devoir, etc.) dans le corpus voeux
>> Séance 3
Informatique textuelle
Séance 3, samedi 21 janvier 2006 à 9h30, CMC 227
9h30-11hA. Salem (professeur à Paris 3) : La lexicométrie, types génériques,
cartographies et genres textuels.11h30-12h30
- Prise en main de Lexico 3 ( Corpus test : résolutions générales CFDT-CGT :
1970 -1992)13h30-16h
- Prise en main de Lexico 3 (suite)
- Traitement des corpus personnels.
Documents:
• Exposé de synthèse - André Salem : Télécharger le diaporama
• Exercice 3.1 : Prise en main de Lexico 3 en cinq étapes - Corpus voeux présidentiels. (PDF)
• Plan des cinq étapes (PDF)
>> Séance 4
Informatique textuelle
Séance 4, samedi 18 février 2006 - 9h30, CMC 2279h30-11h
Analyses de discours, lexicométrie et textométrie, analyse de contenu assistée par ordinateur : autour du logiciel Tropes. Présentation des fonctionnalités du logiciel Récupération de données, indexation de données textuelles, analyse du contenu textuel.
11h15-12h30
- Prise en main de Tropes (version restreinte) à travers un exercice de description du corpus des élections présidentielles américaines (Débat Bush-Kerry, novembre 2004).
13h30 - 16h- Comparaison des résultats Tropes et Cordial sur le corpus Bush- Kerry 2004
- Examen d’une recherche argumentative réalisée à l’aide de Tropes : Trébucq, Mots 2005
- Suite des travaux personnels
Documents:
• Prise en main de Tropes sur le corpus Busk-Kerry (PDF) (HTML)
• Corpus de travail : Bush 1, Kerry 1• Corpus "voeux 2006":
- Chirac, voeux aux Français (décembre 2005),
- Chirac voeux à la presse (janvier 2006)
- Villepin, voeux à la presse (janvier 2006)
- Sarkozy, voeux à la presse (janvier 2006)
>> Séance 5
Informatique textuelle
Séance 5, samedi 11 mars 2006 - 9h30, CMC 2279h30-12h30
1. La méthodologie Alceste.
- Distributions statistiques et distribution linguistique
- Cooccurrences et univers lexicaux
- UCI, UCE, Mots étoilés
- Résultats et interprétations : un exemple2. Prise en main d'Alceste
- Exercice de conversion du corpus Bush- Kerry de Lexico vers Alceste.
- Analyse du corpus BK6 sous Alceste :
Les classes sémantico-thématiques du corpus, les U.C.E caractéristiques.
13h30-16h303. Applications avancées d’ALCESTE sur le corpus voeux
4. Passage Alceste sur les corpus des participants.
Documents :
• Exercice 5.1 : Conversion du corpus BK Lexico, vers Alceste (PDF), (HTML)
• Corpus de travail balisage lexico: Base dynamique
• Bush Kerry balisé pour Alceste : Base dynamique
>> Séance 6
La séance 6 consacrée à Weblex
est annulée et reportée au samedi 27 mai 2006 - 9h30, CMC 227/342
>> Séance 7
Informatique textuelle
Séance 7, samedi 06 mai 2006 - 9h30, CMC 227Exploration textométrique de corpus multilingues
9h30-10h00
Travaux des participants en cours ou achevés ; point sur l’évaluation.
10h - 12h30
Exposé de Maria Zimina-Poirot Postdoc, (EA 2290 SYLED, Université Sorbonne Nouvelle Paris 3)-
Exercices: alignements des textes et repérages des unités lexicales13h30 - 16h
-Comparaison et traitement du corpus multilingue Bush-Kerry
- Suite des travaux personnels
Documents:
- Ressources 7.1: http://www.cavi.univ-paris3.fr/ilpga/ed/student/stmz/ED268-PagePersoMZ_fichiers/stmz/page2.htm
- Ressources 7.2: base dynamque, Bush Kerry, texte 960
Exercices :
- 7.1 : Analyse de corpus de textes juridiques (français/anglais) à l'aide d'outils de statistique textuelle - Lexico3. (Maria Zimina-Poirot).
- 7.2 : Analyse et comparaison du corpus Bush-Kerry multilingue
>> Séance 8
Informatique textuelle
Séance 8
samedi 27 mai 2006 - 9h30, CMC 227/342
9h30-10h15
1. Présentation de travaux des participants2. Traitements lexicométriques et cooccurrences (autour de Weblex)
- Rappel des étapes du cours (JML)
- Cooccurrences et cooccurrenceurs :Notion générale, quatre exemples (PF).Contextes et tris croisés dans Frantext
Cooccurrences dans les énoncés élémentaires (Alceste)
Cooccurrences spécifiques (Lexico3)
WEBLEX : des cooccurrences généralisées aux lexicogrammes.- Les fonction documentaires
- Les fonctions statistiques
- Les fonctions cooccurrentielles (Lexicogrammes simples et récursifs)10h15-11h15
3. Prise en main de WEBLEX. autour du corpus voeux (JML)
- Exercice 8.1 : L'examen de la forme Monde, lexicogrammes, répartition, spécificités.Pause
11h30-13h004. Navigation textométrique : Prise en main du langage CQP de WEBLEX. (PF et JML)
Exercice 8.2 : Exploration des différentes couches d’un corpus, en surface (forme graphique) ou sur les catégories morpho-syntaxiques.
- Le catégoriseur Cordial et son utilisation dans Weblex
- La recherche de motifs (formes graphiques ou catégories).
14h-16h30
Fin des exercices et travaux personnels
Documents:
• Exercice 8.1 : Monde dans les voeux présidentiels : les lexicogrammes récursifs. (PDF)
• Exercice 8.2 : Recherche de motifs sous weblex (PDF)
• Document : Jeu d'étiquettes utilisé sur le corpus voeux pour Weblex (PDF)
Deux liens distincts vers le serveur Weblex:
http://weblex.ens-lsh.fr/wlx/
http://lexico.ens-lsh.fr/local/lexploreur.html