Information importante
La page que vous consultez correspond à l'offre de formation 2023-2024.
Trouvez votre formation pour l'année universitaire 2024-2025
Linguistique de corpus
- Cours (CM) -
- Cours intégrés (CI) -
- Travaux dirigés (TD) 24h
- Travaux pratiques (TP) -
- Travail étudiant (TE) -
Langue de l'enseignement : Français
Description du contenu de l'enseignement
Cet enseignement aborde le traitement des documents numériques (définition, formats divers, encodage et manipulation), la définition et les critères de constitution d'un corpus, les bases textuelles et les corpus disponibles sur Internet. Dans ce cours seront présentés les outils d'exploration de corpus (concordanciers) disponibles en ligne (Frantext, FrWaC, SketchEngine), mais également indépendants (AntConc, TXM). Les mesures statistiques utilisées par les outils d'exploration de corpus seront abordés (information mutuelle, Loglikelihood). Une dernière partie du cours présente des outils d'exploitation des corpus étiquetés et annotés (TXM).
Compétences à acquérir
- Maîtriser les outils d’exploration de corpus
- Connaître les principes de base de la constitution de corpus
- Connaître les principes de base de la constitution de corpus
Contact
Responsable
Amalia Todirascu
Intervenants
Daniela Capin