Bonjour,
Je dois faire une CAH sur des données contenant 122 individus et 27 variables différentes (types d'utilisation du sol). Il est précisé qu'il faut choisir certaines variables donc je me demandais comment savoir lesquelles sont pertinentes pour faire la classification? (je dois me baser sur les corrélations ?) Quels critères me permettent de choisir?

et ma deuxième question : quels sont les avantages de choisir une distance euclidienne carrées plutôt qu'une autre? (distance indiquée dans la donnée)

Merci!