Le 31 mai 2018, Prim’Act a organisé un petit-déjeuner sous forme de retour d’expérience sur le thème « Machine Learning, intelligence artificielle : intégrer les techniques d’apprentissage dans les modèles actuariels ».
La présentation a porté sur les modèles de tarification issus de la datascience appliqués à titre d’illustration à l’auto : modèle paramétrique de régression (GLM) et modèles non paramétriques.
Les modèles non paramétriques peuvent en effet permettre de pallier à certaines limites du GLM, le GLM présentant des difficultés d’utilisation lorsque le nombre de variables explicatives étudiées devient important. Ces méthodes non paramétriques, dont les bases ont été développées dans les années 1970 et les premières applications effectuées dans les années 1990 en biostatistique se généralisent actuellement du fait de l’augmentation de la puissance des ordinateurs.
Les trois modèles présentés qui ont fait l’objet d’une comparaison sont : le GLM, le RGLM (aggrégation de modèles) et le GBM (boosting).
Les résultats et pouvoirs prédictifs des différentes méthodes sont résumés dans le tableau suivant :
On observe sur les travaux menés que les modèles « matching learning » sont les plus précis et prédictifs, au prix d’une interprétation plus délicate à réaliser. Attention toutefois, quelle que soit l’approche retenue, il est indispensable de choisir avec attention les variables explicatives potentielles et de ne pas laisser dans le modèles des variables qui ne refléteraient pas un lien causal justifiable
L’équipe Prim’Act