Résumé
L'utilisation de la lemmatisation dans les analyses lexicométriques a été popularisée par le logiciel Alceste de Max Reinert. Un débat méthodologique récurrent en lexicométrie partage encore aujourd'hui les partisans de la lemmatisation et ceux qui préfèrent analyser directement les textes non lemmatisés en distinguant les pluriels des singuliers, les formes conjuguées des verbes, le féminin du masculin.
L'avantage souvent reconnu de la lemmatisation est la plus grande stabilité des analyses et notamment l'évitement de corrélations entre formes graphiques difficilement interprétables.
Cependant, la lemmatisation peut être effectuée de façon plus ou moins poussée et la stabilité des typologies obtenues selon le degré de lemmatisation appliqué a été jusqu'à présent peu testé.
Cette étude établit des comparaisons à partir de plusieurs corpus issus de l'enquête "Consommation" du CRÉDOC. Ces différents tests de robustesse de la méthodologie Alceste permettent de préciser les limites d'interprétation des typologies de représentations obtenues par lexicométrie au moyen de ce logiciel.