8. L'arbre de décision - les avantages et les inconvénients

Maintenant comme vous connaissez déjà la notion d'arbre de décision, nous pouvons introduire les deux types d'arbre ainsi que parler des avantages et des inconvénients.


Types d'arbre de décision

Nous pouvons différencier deux types des arbres de décision qui sont classés en fonction des variables cibles :


  • Categorical variable decision tree -  dans ce cas, l'algorithme a une variable cible catégorique. Par exemple, la prédiction du prix relatif d'une maison dans l'une des trois catégories suivantes : faible, moyen ou élevé. Les caractéristiques peuvent inclure la surface, le nombre de chambres, la présence d’un jardin et le quartier. L'arbre de décision apprend de ces caractéristiques et, après avoir fait passer chaque point de données par chaque nœud, il aboutit à un nœud feuille de l'une des trois cibles catégoriques : faible, moyen ou élevé.


  • Continuous variable decision treedans ce cas, les caractéristiques entrées dans l'arbre de décision (par exemple, les qualités d'une maison) seront utilisées pour prédire une sortie continue (par exemple, le prix de cette maison).


Les avantages et les inconvénients.



Premièrement, les arbres de décision prennent très peu de temps pour traiter les données par rapport aux autres algorithmes. Les étapes de préparation de données comme par exemple la normalisation, la transformation et la mise à l'échelle des données ne sont pas nécessaires. Deuxièmement, la performance d’un modèle n’est pas affectée par des valeurs manquantes dans l’ensemble de données. Pour finir, un modèle d'arbre de décision est intuitif et facile à expliquer aux directions métier dans l’organisation, ainsi que permet de représenter visuellement et explicitement les décisions et le processus décisionnel.


Parlons des inconvénient, dans les arbres de décision, de petits changements dans les données au fil du temps peuvent provoquer un grand changement dans la structure de l'arbre de décision, ce qui peut résulter en instabilité. Le temps d’apprentissage augmente considérablement, proportionnellement à la volumétrie de l'ensemble de données. Dans certains cas, les modèles peuvent devenir trop complexes par rapport aux autres algorithmes traditionnels.



Commentaires

Enregistrer un commentaire

Posts les plus consultés de ce blog

10. Le deep learning, Quand l'élève peut dépasser le maître ?

1. Data dans le Marketing - Introduction