Construction d'un corpus et perte d'information
en analyse lexicale (Méthodes et pratiques)

S. Lion

Cahier de recherche N°C13

Résumé

Objectifs : mise en place d'une méthodologie pour la constitution d'un corpus lexical apuré. Prise en compte des contraintes de saisies et restauration du matériau lexical. Constructions d'indicateurs syntaxiques propres à enrichir l'approche lexicométrique. Analyse des différentes articulations du langage et estimation des pertes d'information liées à la nature de l'analyse du langage.

Méthodes et procédures : ces recherches ont été réalisées au sein du département, en y associant un groupe de travail de cinq étudiants de 3ème année de l'ENSAE (division SEA). L'étude a porté sur des questions ouvertes tirées de sources existantes - enquête sur les comportements alimentaires des Français (CRÉDOC, 1988), enquête sur les aspirations des Français (CRÉDOC, 1990) - et de sources nouvelles - interview réalisées par les élèves du groupe de travail. Un matériel spécifique fut utilisé : un scanner et un logiciel de reconnaissance de caractères.

Résultats : fourniture d'un rapport comprenant la synthèse des travaux réalisés, un exemple d'application sur l'espace lexicométrique des personnes âgées face à la question "pour vous, est-ce que bien manger?" et la retranscription intégrale des interviews menés par le groupe de travail des élèves de l'ENSAE.


Contact

142, rue du Chevaleret 75013 Paris
01 40 77 85 10

ligne 6 station Chevaleret
ligne 14 station Bibliothèque
RER C station Bibliothèque
Bus 27 arrêt Nationale