Résumé
Cette vidéo explore comment les modèles de prédiction de séries temporelles, alimentés par l'IA, transforment divers secteurs en anticipant les besoins futurs. L'invité, Jofroid, fondateur de The Forecasting Company, explique comment ces modèles, en ingérant d'énormes quantités de données hétérogènes, peuvent prédire des événements futurs avec une précision croissante. La discussion met en lumière les limites des approches traditionnelles, l'impact des Transformers et l'importance des données synthétiques pour améliorer les prédictions.
- Les modèles de prédiction de séries temporelles permettent d'anticiper les besoins futurs dans divers secteurs.
- L'ingestion de données hétérogènes et l'utilisation de Transformers améliorent la précision des prédictions.
- Les données synthétiques jouent un rôle crucial pour surmonter le manque de données réelles et améliorer les performances des modèles.
Introduction : L'importance de la prédiction [0:00]
La vidéo commence par illustrer comment Amazon utilise des modèles avancés pour prédire les achats et optimiser l'emplacement de ses stocks, permettant ainsi des livraisons en 24 heures. Ce problème de prédiction est fondamental dans de nombreux domaines, comme anticiper les admissions aux urgences ou la demande en énergie. L'approche actuelle, avec des modèles ultra spécialisés, est limitée et ne permet pas de capturer les interactions complexes du monde réel.
Les limites des modèles traditionnels [2:40]
Les systèmes statistiques traditionnels, comme les moyennes glissantes, ne prennent pas en compte les fluctuations de la demande ni les informations extérieures. Par exemple, ils ont du mal à intégrer l'impact d'un festival sur une pizzeria voisine ou l'effet d'une tendance TikTok sur la demande mondiale. Les modèles de prédiction des ouragans développés par l'Air Force américaine dans les années 50 étaient très spécifiques et coûteux, basés sur des simulations physiques.
L'avènement des Transformers et des modèles de fondation [8:42]
L'arrivée des Transformers a révolutionné le domaine de la prédiction. Alors que les modèles de langage prédisent du texte, l'idée est d'appliquer ce principe aux séries temporelles en prédisant des chiffres. Contrairement au texte, où il peut y avoir des synonymes, la prédiction est soit juste, soit fausse, ce qui facilite l'itération et l'amélioration des modèles. La difficulté réside dans le manque de données de séries temporelles publiques et la diversité des sources de données.
The Forecasting Company et l'approche générique [12:46]
The Forecasting Company tente de créer un modèle de fondation capable d'apprendre à partir de données extrêmement diverses, comme le PIB, l'usage du cloud, l'énergie, les hôpitaux et les ventes de pizzas. Le "context engineering" est crucial pour fournir au modèle les informations pertinentes, comme les événements locaux pour une pizzeria près d'un parc. L'intégration de données alternatives, comme les données de localisation mobile ou les données satellite, peut également améliorer les prédictions.
Fonctionnement du modèle : RAG et distribution des prédictions [15:40]
Le modèle utilise un Transformer entraîné sur des variables cibles et un système de RAG (Retrieval Augmented Generation) pour rechercher les informations pertinentes. Le modèle ne se contente pas de donner une prédiction unique, mais fournit une distribution de probabilités pour quantifier l'incertitude. Cette approche permet une meilleure gestion des risques et des décisions plus éclairées.
Prédiction de la crise de 2008 : un exemple concret [17:55]
L'exemple de la crise de 2008 montre comment le modèle peut détecter des signaux faibles et anticiper des événements majeurs. En analysant les données de vente de maisons et l'indice des prix, le modèle peut identifier des anomalies et fournir un intervalle de confiance plus large, indiquant une incertitude accrue. L'ajout d'informations contextuelles améliore la précision des prédictions.
La consolidation des modèles et le transfert d'information [23:14]
La consolidation des modèles permet de réduire les coûts de maintenance et d'améliorer le transfert d'information. Un modèle unique entraîné sur un large éventail de données est plus flexible et performant que plusieurs modèles spécialisés. Cette approche permet également une meilleure allocation des ressources et une source de vérité fiable pour toute l'entreprise.
L'avenir de la prédiction : données synthétiques et impact [28:44]
Les données synthétiques offrent une solution prometteuse pour surmonter le manque de données réelles. En générant des données structurées à partir de modèles de langage, il est possible d'entraîner des modèles de prédiction sans problème de fuite d'information. L'impact potentiel de ces modèles est énorme, car ils peuvent améliorer la gestion des entreprises, réduire le gaspillage et améliorer les conditions de travail.