Vous êtes ici :

Faculté des langues

Information importante

La page que vous consultez correspond à l'offre de formation 2023-2024.

Trouvez votre formation pour l'année universitaire 2024-2025

Analyse de données

  • Cours (CM) -
  • Cours intégrés (CI) -
  • Travaux dirigés (TD) 12h
  • Travaux pratiques (TP) -
  • Travail étudiant (TE) -

Langue de l'enseignement : Français

Enseignement proposé : en présentiel enrichi de ressources pédagogiques numériques

Description du contenu de l'enseignement

  • Collecte de données à partir du web : développement de programmes pour télécharger, analyser la structure hiérarchique et extraire le contenu textuel principal de pages HTML.
  • Traitement de données avec la bibliothèque pandas : nettoyage et prétraitement des données, analyse univariée, analyse bivariée, visualisation.
  • Vectorisation de textes : décomposition des textes en unités, normalisation et autres prétraitements, visualisations, pondération tf-idf.

Compétences à acquérir

  • Collecter des corpus de textes à partir du web.
  • Nettoyer, prétraiter, analyser et visualiser des données tabulées.
  • Traiter des données textuelles pour obtenir des représentations vectorielles.

Contact

Faculté des langues

22, rue René Descartes
67084 STRASBOURG CEDEX

Formulaire de contact

Responsable

Delphine Bernhard

Intervenants

Delphine Bernhard


MASTER - Traduction et interprétation

Partenaires

Logo du CNRS
Logo Établissement associé de l'Université de Strasbourg
Logo du réseau Epicur
Logo de EUCOR, Le Campus européen
Logo de l'Inserm Grand Est
Logo de l'Inria

Labels

Logo du label Bienvenue en France
Logo du programme HRS4R
Logo du programme France 2030
Logo de Service Public+

Réseaux

Logo de France Universités
Logo de la Ligue européenne des universités de recherche (LERU)
Logo du réseau Udice
Logo de l'Université franco-allemande