Les humains ont toujours rêvé de prédire l’avenir. La mise en œuvre de l’apprentissage automatique a facilité cette ambition. Afin de répondre à la question posée, nous pouvons utiliser la définition suivante : « Le Machine Learning est un ensemble d'outils statistiques ou géométriques et d'algorithmes informatiques qui permettent à une machine d’apprendre à partir d’un jeu de données, pour ensuite réaliser une tâche, sans avoir été explicitement programmée à cet effet. » Nous pouvons différencier les deux catégories du Machine Learning : Supervisé : les algorithmes supervisés extraient de la connaissance à partir d’un jeu de données. Le modèle apprend la relation entre un ensemble de caractéristiques descriptives et une caractéristique cible. Nous pouvons utiliser ce modèle pour faire des prédictions de nouvelles observations (exemple : Régression). Non supervisé : les algorithmes cherchent à organiser les données en catégories. Dans ce cas, comme l’apprentissage ne présu...
Les approches de l'apprentissage automatique basées sur la similarité partent de l'idée que la meilleure façon de faire des prédictions est de simplement regarder ce qui a bien fonctionné dans le passé et de prédire à nouveau la même chose. Nous allons commencer par l'explication des mesures de similarité. L'une des métriques de caractéristiques les plus connues est la distance euclidienne qui calcule la longueur de la ligne droite entre deux points. La distance euclidienne est définie avec la formule mathématique suivante : Nous choisissons la fonction de distance en fonction des types de données que nous traitons. Si nous avons des données quantitatives du même type (par exemple : poids, salaire, taille, montant du panier, etc.), la distance euclidienne semble être un bon choix. Pour faire une prédiction, l'algorithme KNN va utiliser l'ensemble du jeu de données. En effet, pour une observation qui ne fait pas partie du jeu de données et qui est la valeur ré...
Maintenant comme vous connaissez déjà la notion d'arbre de décision, nous pouvons introduire les deux types d'arbre ainsi que parler des avantages et des inconvénients . Types d'arbre de décision Nous pouvons différencier deux types des arbres de décision qui sont classés en fonction des variables cibles : Categorical variable decision tree - dans ce cas, l'algorithme a une variable cible catégorique. Par exemple, la prédiction du prix relatif d'une maison dans l'une des trois catégories suivantes : faible, moyen ou élevé. Les caractéristiques peuvent inclure la surface, le nombre de chambres, la présence d’un jardin et le quartier. L'arbre de décision apprend de ces caractéristiques et, après avoir fait passer chaque point de données par chaque nœud, il aboutit à un nœud feuille de l'une des trois cibles catégoriques : faible, moyen ou élevé. Continuous variable decision tree - dans ce cas, les caractéristiques entrées dans l'arbre de décision ...
interesting video !
RépondreSupprimermerci beaucoup!
RépondreSupprimerThx !
RépondreSupprimerMerci d'avoir partagé
RépondreSupprimer