Cette vidéo présente un dialogue captivant entre deux experts de renom de l’économétrie française, Valérie Mignon et Emmanuel Flachaire. Sous la direction de Lionel Ragot, ils explorent les mutations profondes de la science économique à l’ère des données massives.
Le débat pose une question méthodologique cruciale : comment l’économétrie, science quantitative traditionnelle, peut-elle s’adapter et coexister avec la montée en puissance de l’intelligence artificielle et de l’apprentissage automatique ?
Résumé des points abordés
Ce qu’il faut retenir
- L’interprétabilité et la causalité restent la chasse gardée de l’économétrie : alors que le machine learning excelle dans la prédiction pure grâce à des modèles flexibles, l’économétrie cherche à comprendre les mécanismes sous-jacents et à quantifier les relations de cause à effet.
- Le machine learning agit comme une extension non paramétrique puissante : il permet de surmonter le fléau de la dimension et de traiter des volumes massifs de données (big data) sans imposer de spécification rigide à priori.
- L’avenir réside dans la formation d’économistes « data scientists » : les entreprises recherchent des profils capables de manier les algorithmes, tout en conservant le recul critique, l’éthique et la rigueur théorique propres à l’analyse économique.
Qu’est-ce que l’économétrie ?
L’économétrie est définie comme une branche singulière de la science économique. Elle unit la théorie économique, les mathématiques, la statistique et l’informatique.
Valérie Mignon rappelle la définition originelle formulée par Ragnar Frisch en 1933. Selon lui, aucune de ces disciplines prise isolément ne suffit à comprendre les relations quantitatives de la vie économique. C’est leur unification qui crée la véritable puissance de l’outil.
Concrètement, cette science consiste à mesurer des phénomènes réels à partir d’observations. L’objectif principal est d’estimer les paramètres d’un modèle pour quantifier des relations économiques.
Les économètres s’appuient sur une approche par inférence statistique. Ils associent à chaque estimation des mesures de précision, comme des écarts-types.
La notion de causalité est au cœur de la discipline. L’économètre cherche à prouver qu’une variable cause un effet sur une autre variable. Les invités insistent sur un principe fondamental : la corrélation n’est pas la causalité.
Pour illustrer ce piège, ils citent des exemples frappants. On observe souvent plus de policiers dans les villes où le taux de criminalité est élevé. On ne peut pourtant pas en déduire que les policiers provoquent le crime.
L’histoire de l’économétrie montre une évolution rythmée par la nature des données disponibles. Elle naît officiellement dans les années 1930, propulsée par la crise de 1929.
Les grands modèles macroéconométriques structurels se développent ensuite pour guider la décision publique. Ces modèles s’effondrent lors des chocs pétroliers des années 1970 en raison de la stagflation et de la critique de Lucas.
La discipline se réinvente alors. Elle se tourne vers l’économétrie des séries temporelles, puis vers la microéconométrie dans les années 1990.
Ce dernier virage est rendu possible par l’accès aux données individuelles d’enquêtes et d’entreprises. Les économètres développent des approches randomisées et des méthodes d’évaluation des politiques publiques.
L’essor de l’intelligence artificielle et du machine learning
L’intelligence artificielle est un concept vaste qui ne possède pas de définition unique. Emmanuel Flachaire la décrit comme le développement de machines capables d’exécuter des tâches exigeant normalement l’intelligence humaine.
Cette révolution est portée par la transition numérique et l’explosion des données massives. Le secteur privé, notamment les géants de la technologie, joue un rôle moteur dans son financement.
Au sein de l’intelligence artificielle, le machine learning occupe une place centrale. Il s’agit d’un ensemble de méthodes d’apprentissage automatique.
Contrairement à la programmation traditionnelle, ces algorithmes ne suivent pas des instructions logiques et déterministes. Ils sont entraînés sur des bases de données pour devenir probabilistes.
L’algorithme apprend par lui-même à repérer les structures et à optimiser ses prédictions. Les progrès récents sont spectaculaires.
Ils touchent la reconnaissance vocale, la traduction automatique ou encore la conduite autonome. Le deep learning, ou apprentissage profond, représente une sous-branche encore plus complexe.
Il utilise des réseaux de neurones pour modéliser des relations hautement non linéaires. Emmanuel Flachaire retrace le lien entre ces méthodes et les techniques statistiques.
Des techniques comme le Ridge ou le Lasso, développées pour la régression paramétrique, ont ouvert la voie. Elles permettent de contraindre les coefficients pour éviter l’instabilité face à un grand nombre de variables. Le Lasso effectue même une sélection automatique des variables explicatives.
Le machine learning propose un cadre totalement non paramétrique. Des outils comme les forêts aléatoires ou le boosting capturent les interactions complexes entre les variables.
Ils s’affranchissent des présupposés rigides. Les données parlent d’elles-mêmes sans qu’il soit nécessaire de postuler une forme géométrique à priori.
Forces, limites et divergences méthodologiques
Les deux approches se distinguent fondamentalement par leurs objectifs premiers. L’économétrie repose sur quatre piliers : le résumé des données, l’estimation des paramètres, les tests d’hypothèses et la prévision.
Le machine learning, quant à lui, se focalise de manière quasi exclusive sur le dernier point : la prédiction pure.
Cette divergence crée des forces et des faiblesses propres à chaque camp. Valérie Mignon critique l’effet « boîte noire » des algorithmes d’apprentissage profond.
Leurs structures sont devenues tellement complexes qu’elles échappent parfois à la compréhension humaine. L’économétrie conservent l’avantage d’une interprétabilité totale, car elle repose sur des fondements probabilistes clairs.
La gestion de la causalité constitue une autre limite majeure de l’intelligence artificielle. Valérie Mignon utilise la métaphore du chien de Pavlov pour illustrer ce défaut.
Un algorithme peut associer une récompense à un comportement purement fortuit, comme se gratter l’oreille juste avant de trouver une truffe. Il confond ainsi une simple concomitance temporelle avec un lien de causalité direct.
Emmanuel Flachaire soulève également la question cruciale des biais algorithmiques et des discriminations. Il évoque le logiciel utilisé aux États-Unis pour évaluer le risque de récidive des détenus.
Entraîné sur des données historiques biaisées, l’algorithme a reproduit et amplifié les discriminations envers la population afro-américaine. L’apprentissage automatique ne corrige pas ses propres erreurs à moins d’intégrer des correctifs statistiques.
La stabilité des prédictions pose aussi un problème de taille. Les algorithmes sont sensibles aux changements d’environnement.
Les invités citent l’échec de Google Flu, qui prédisait les vagues de grippe à partir des recherches des utilisateurs. L’apparition d’événements inhabituels, comme la grippe aviaire, a totalement faussé le modèle.
De même, les systèmes de reconnaissance visuelle des véhicules autonomes peuvent être perturbés par un simple autocollant sur un panneau stop.
L’interpénétration des disciplines et l’avenir de la formation
Malgré ces divergences, les intervenants refusent d’opposer stérilement les deux disciplines. Ils prônent une approche complémentaire et soulignent que la frontière est poreuse.
Le modèle de régression linéaire reste la base commune du machine learning et de l’économétrie. De plus, le modèle logit utilisé par les économètres s’apparente directement au perceptron des informaticiens.
Le machine learning s’invite désormais dans les travaux économétriques comme une étape préliminaire. Il permet de traiter les données massives impossibles à charger dans des logiciels classiques.
Les méthodes non supervisées aident à regrouper les données en clusters homogènes, ce qui réduit efficacement la dimension des problèmes.
L’apprentissage automatique sert aussi à valider les spécifications des modèles économétriques. En comparing les performances de prédiction, l’économètre peut détecter si son modèle paramétrique a omis des non-linéarités importantes.
Si l’écart de performance est faible ou non significatif, le modèle paramétrique simple doit être privilégié pour son interprétabilité. La recherche actuelle à la frontière des deux sciences progresse rapidement.
Des chercheurs développent des estimateurs doublement robustes. Ces méthodes intègrent le machine learning pour modéliser les variables de nuisance, tout en garantissant des propriétés statistiques rigoureuses pour le paramètre causal d’intérêt.
Face à ces évolutions, la question de l’enseignement de l’économie devient cruciale. Interrogés sur l’arbitrage budgétaire dans les universités, les deux professeurs s’accordent sur une priorité claire : il faut maintenir le cours d’économétrie.
On ne peut pas enseigner des méthodes complexes sans maîtriser la base des moindres carrés.
L’objectif des facultés d’économie n’est pas de former des data scientists purs. Il s’agit plutôt de former des « data scientists économistes ».
Ces profils hybrides possèdent une double compétence unique : la maîtrise des outils quantitatifs et une solide compréhension de la théorie économique. Cette valeur ajoutée est essentielle pour les entreprises, car elle apporte le recul nécessaire sur l’interprétation, la causalité et la détection des discriminations.