L'augmentation des données non structurées, propulsée par les nouvelles technologies, est en train de basculer les marchés et la gestion des activités de marketing. Malheureusement, ces données restent pour la plupart inexploitées par de nombreuses entreprises, ce qui laisse entrevoir le potentiel de développement de la recherche. Customer tracking data La possibilité de contrôler et d'analyser les données est devenue de plus en plus accessible ces dernières années, et il est plus que jamais important pour les entreprises de l'utiliser correctement. Les données de parcours en ligne, désormais courantes, conservent les journaux des activités suivantes: d'achat, de recherche, de navigation, de consommation de médias numériques et d'autres actions de navigation sur le web. Les appareils mobiles étendent encore la portée du suivi des activités au monde hors ligne, en enregistrant les emplacements physiques des consommateurs et leurs visites dans les magasins. La prolif...
Aujourd'hui nous allons expliquer l'arbre de décision - un algorithme basique du Machine Learning. Un arbre de décision a de nombreuses analogies dans la vie réelle et il s'avère qu'il a influencé un vaste domaine de l'apprentissage automatique, permettant à la fois de résoudre des problèmes de classification et de régression. En analyse décisionnelle, un arbre de décision peut être utilisé pour représenter visuellement et explicitement les décisions. Chaque arbre possède un nœud racine (root node) qui correspond à une question, par lequel passent les entrées. Ce nœud racine est ensuite divisé en ensembles de nœuds de décision (decision node) où les résultats et les observations sont basés sur des conditions. Si un nœud ne se divise pas en d'autres nœuds, il est appelé une feuille qui ensuite contiendra la réponse à notre question. Une sous-section d'un arbre décisionnel est appelée une branche (branch). Cela peut être visualiser avec l'aide de schéma ...
Les approches de l'apprentissage automatique basées sur la similarité partent de l'idée que la meilleure façon de faire des prédictions est de simplement regarder ce qui a bien fonctionné dans le passé et de prédire à nouveau la même chose. Nous allons commencer par l'explication des mesures de similarité. L'une des métriques de caractéristiques les plus connues est la distance euclidienne qui calcule la longueur de la ligne droite entre deux points. La distance euclidienne est définie avec la formule mathématique suivante : Nous choisissons la fonction de distance en fonction des types de données que nous traitons. Si nous avons des données quantitatives du même type (par exemple : poids, salaire, taille, montant du panier, etc.), la distance euclidienne semble être un bon choix. Pour faire une prédiction, l'algorithme KNN va utiliser l'ensemble du jeu de données. En effet, pour une observation qui ne fait pas partie du jeu de données et qui est la valeur ré...
interesting video !
RépondreSupprimermerci beaucoup!
RépondreSupprimerThx !
RépondreSupprimerMerci d'avoir partagé
RépondreSupprimer