Maintenant comme vous connaissez déjà la notion d'arbre de décision, nous pouvons introduire les deux types d'arbre ainsi que parler des avantages et des inconvénients . Types d'arbre de décision Nous pouvons différencier deux types des arbres de décision qui sont classés en fonction des variables cibles : Categorical variable decision tree - dans ce cas, l'algorithme a une variable cible catégorique. Par exemple, la prédiction du prix relatif d'une maison dans l'une des trois catégories suivantes : faible, moyen ou élevé. Les caractéristiques peuvent inclure la surface, le nombre de chambres, la présence d’un jardin et le quartier. L'arbre de décision apprend de ces caractéristiques et, après avoir fait passer chaque point de données par chaque nœud, il aboutit à un nœud feuille de l'une des trois cibles catégoriques : faible, moyen ou élevé. Continuous variable decision tree - dans ce cas, les caractéristiques entrées dans l'arbre de décision ...
Les approches de l'apprentissage automatique basées sur la similarité partent de l'idée que la meilleure façon de faire des prédictions est de simplement regarder ce qui a bien fonctionné dans le passé et de prédire à nouveau la même chose. Nous allons commencer par l'explication des mesures de similarité. L'une des métriques de caractéristiques les plus connues est la distance euclidienne qui calcule la longueur de la ligne droite entre deux points. La distance euclidienne est définie avec la formule mathématique suivante : Nous choisissons la fonction de distance en fonction des types de données que nous traitons. Si nous avons des données quantitatives du même type (par exemple : poids, salaire, taille, montant du panier, etc.), la distance euclidienne semble être un bon choix. Pour faire une prédiction, l'algorithme KNN va utiliser l'ensemble du jeu de données. En effet, pour une observation qui ne fait pas partie du jeu de données et qui est la valeur ré...
L'augmentation des données non structurées, propulsée par les nouvelles technologies, est en train de basculer les marchés et la gestion des activités de marketing. Malheureusement, ces données restent pour la plupart inexploitées par de nombreuses entreprises, ce qui laisse entrevoir le potentiel de développement de la recherche. Customer tracking data La possibilité de contrôler et d'analyser les données est devenue de plus en plus accessible ces dernières années, et il est plus que jamais important pour les entreprises de l'utiliser correctement. Les données de parcours en ligne, désormais courantes, conservent les journaux des activités suivantes: d'achat, de recherche, de navigation, de consommation de médias numériques et d'autres actions de navigation sur le web. Les appareils mobiles étendent encore la portée du suivi des activités au monde hors ligne, en enregistrant les emplacements physiques des consommateurs et leurs visites dans les magasins. La prolif...
interesting video !
RépondreSupprimermerci beaucoup!
RépondreSupprimerThx !
RépondreSupprimerMerci d'avoir partagé
RépondreSupprimer