jeudi 13 février 2014

Grille de score

En scoring, un cadre particulier de l’apprentissage supervisé où la variable cible est binaire (modalité positive vs. négative), une grille de score est un système de notation permettant d’apprécier la propension à être positif des individus. Il peut s’agir par exemple de situer la capacité d’une personne à rembourser un crédit contracté auprès d’un établissement bancaire, on aurait alors un mécanisme du type : personne en CDI, + 30 points ; propriétaire de son logement, + 20 points ; elle n’a pas d’autre crédit en cours, +25 points ; etc.

Des outils classiques de l’apprentissage statistique (régression logistique, analyse discriminante, etc.) permettent d’estimer directement la probabilité d’être positif des individus. Malheureusement, les solutions fournies – les coefficients des modèles prédictifs, parfois positifs, d’autres fois négatifs, appliquées à des variables définies sur des échelles différentes – s’avèrent quelquefois peu lisibles, hors de portée des non-initiés. L’objectif de la grille de score est de transformer ces coefficients en un système de points entrant dans une notation globale des individus. Cette représentation cumule plusieurs avantages : le score global est calibré, son domaine de définition est connu à l’avance (ex. 0 à 100) ; le déploiement est facilité, il suffit de recenser les caractéristiques des individus et de sommer les points associés ; l’interprétation est immédiate, l’influence des caractéristiques sur l’appréciation d’un individu est directement identifiable.

Ce support décrit la transformation des coefficients d’un modèle issu de la régression logistique en un système de notation.

Mots clés : scoring, grille de score, apprentissage supervisé,discrétisation, mdlpc
Lien : grille_de_score.pdf
Données : pret_acceptation_score.xls
Références :
G. Saporta, « Probabilités, Analyse de données et Statistique », Technip, 2006 ; pp. 462 à 467, section 18.4.3 « Un exemple de 'credit scoring' ».
J.P. Nakache, J. Confais, « Statistique explicative appliquée », Technip, 2003 ; pp. 58 à 60, section 2.2.2 « SCORE : construction d’un score ».