La modélisation prédictive est une technique qui utilise des méthodes mathématiques et informatiques pour prédire un événement ou un résultat. Une approche mathématique utilise un modèle basé sur des équations qui décrit le phénomène considéré. Le modèle est utilisé pour prévoir un résultat dans un état ou un moment futur en fonction des modifications apportées aux entrées du modèle. Les paramètres du modèle permettent d’expliquer comment les entrées du modèle influencent le résultat. Les exemples incluent les modèles de régression de séries temporelles pour prédire le volume du trafic aérien ou prédire l’efficacité du carburant sur la base d’un modèle de régression linéaire de la vitesse du moteur en fonction de la charge.
L’approche de modélisation prédictive computationnelle diffère de l’approche mathématique car elle s’appuie sur des modèles qui ne sont pas faciles à expliquer sous forme d’équation et qui nécessitent souvent des techniques de simulation pour créer une prédiction. Cette approche est souvent appelée modélisation prédictive « boîte noire », car la structure du modèle ne permet pas de comprendre les facteurs qui font correspondre les entrées du modèle aux résultats. Les exemples incluent l’utilisation de réseaux neuronaux pour prédire de quel établissement vinicole provient un verre de vin ou d’arbres de décision en sac pour prédire la cote de crédit d’un emprunteur.
La modélisation prédictive est souvent réalisée à l’aide d’un ajustement de courbe et de surface, d’une régression de séries chronologiques ou d’approches d’apprentissage automatique. Quelle que soit l’approche utilisée, le processus de création d’un modèle prédictif est le même pour toutes les méthodes. Les étapes sont les suivantes :