Introduction au Machine Learning

IA > ML > DL > generative models

AGI vs ANI vs ASI

modèles génératifs

prendre des décisions = faire une classification

en se basant sur les données -> en "apprenant"

en économie et en psychologie, on cherche à trouver des modèles des processus sous-jacents

en statistique, on cherche un modèle qui correspond aux données

le commentaire est-il positif ou négatif ?

la transaction est-elle frauduleuse ?

qui essaye de déverrouiller le téléphone ?

dois-je tourner à gauche, à droite, accélérer, freiner ?

est-ce qu'il va pleuvoir dans l'heure ?

quel produit va aimer tel utilisateur ?

modèles de classification ou de regression (avec Y dans les réels)

on connait les classes Y (étiquettes), on connait également les exemples X (caractéristiques)

faire de la réduction de dimensions

identifier des groupes dans un ensemble d'utilisateurs (clustering)

détection d'anomalies

robot qui doit apprendre à marcher

IA qui joue à Mario

erreur = somme des carrés des résidus

La distance de Levenshtein est une distance, au sens mathématique du terme, donnant une mesure de la différence entre deux chaînes de caractères. Elle est égale au nombre minimal de caractères qu'il faut supprimer, insérer ou remplacer pour passer d'une chaîne à l'autre.

L(chien, chat) = 3

distance euclidienne (à vol d'oiseau)

distance de manhattan

la séparation en plusieurs ensembles : train, validation, test

http://nirvacana.com/thoughts/2013/07/08/becoming-a-data-scientist/

nettoyer les données

arbre de décision, forêt aléatoire, régression logistique, réseau de neurone, SVM, K-plus-proches-voisins

https://scikit-learn.org/stable/auto_examples/classification/plot_classifier_comparison.html#sphx-glr-auto-examples-classification-plot-classifier-comparison-py

Introduction au Machine Learning

Présentation

Le machine learning ???

Vocabulaire

Définition

Prendre des décisions

Faire des prédictions

Applications

Les principaux types

L'apprentissage supervisé

L'apprentissage non-supervisé

L'apprentissage par renforcement

Comment ça marche ?

L'entrainement d'un modèle

Définir un critère d'évaluation de l'erreur

Éviter le sous-apprentissage et le sur-apprentissage

La mise en oeuvre

Cadrer le problème

Quelques modèles

Les arbres de décision

Les forêts aléatoires

Les réseaux de neurones

Les KNN

Conclusion

Ressources pour aller plus loin :