Textopol > Enseignement >

Séminaire doctoral - Archives 2006-2007
 


Université Paris12 Val de Marne
Ecole doctorale Lettres, langues,
sciences humaines et sociales.

fiala@univ-paris12.fr



Traitement automatisé des discours :
Distributions linguistiques et corrélations statistiques
Séance mensuelle : samedi 9h 30 - 16h30 ;
salles informatiques CMC 227 et 342

Responsable : P. Fiala








Les six séances mensuelles constituent une introduction progressive à l'analyse informatisée des corpus textuels. Chacune comprend l'exposé d'une problématique liée à la prise en main d'un logiciel. Des exercices pratiques en linguistique de corpus et en statistique textuelle permettent de répondre aux questions pratiques. Un objectif collectif consiste à affiner un document comparatif sur les fonctionnalités des divers logiciels à partir des domaines de recherche et des expériences des participants.

Déroulement des séances : 3 heures de cours ; 3 heures de TD. Un accès libre aux postes de travail équipés des logiciels est prévu le mardi suivant chaque séance mensuelle, sous la responsabilité de JM Leblanc, docteur en linguistique informatique. Formations complémentaires possibles: Xlstat, END-NOTE.

Le séminaire s'adresse aux doctorants et aux étudiants en Master 2 de Paris-12, et des autres universités dans la limite des places disponibles, titulaires du C2i ou ayant suivi avec succès un cours d'informatique textuelle. Il nécessite une inscription préalable.

 

 


Programme des séances

 



1. Samedi 28 octobre 2006 :

Etiqueter, quantifier, décrire les textes (Logiciel Cordial. Toulouse). Rechercher des formes, des contextes, des schémas syntaxiques, des propriétés sémantiques dans un corpus textuel (Base textuelle littéraire Frantext, Nancy ; Logiciel Stella et filtres lexico-grammaticaux).

2. Samedi 18 novembre 2006 :

Construire et analyser des corpus lexicométriques (Hyperbase, E. Brunet, Nice). Fonctions documentaires et fonctions statistiques ; distance intertextuelle.

3. Samedi 16 décembre 2006 :

Expérimentations lexicométriques, topographies textuelles, typologies génériques (Lexico3, A. Salem Paris3).

4. Samedi 20 janvier 2007 :

Analyses lexicométriques et analyses de contenu (Tropes). Cooccurrences dans les énoncés et mondes sémantiques (Alceste, M. Reiner, Saint-Quentin)

5. Samedi 17 février 2007 :

Voisinages lexicaux ; cooccurrences dans les textes ; tableaux de propriétés textuelles  (Weblex et les grammaires MPC ; S. Heiden, ENS-Lyon).

6. Samedi 24 mars 2007 :

Les corpus multilingues : Alignements, traitements lexicométriques de corpus multilingues ( Maria Zimina-Poirot, docteure Paris3).

 


<< Retour rubriques Textopol - Exercices - Programme détaillé des séances - Retour calendrier >>
INFORMATIONS et INSCRIPTIONS: fiala@univ-paris12.fr