Un outil web simple pour modéliser les incertitudes dans les calculs. L'interface de Guesstimate est similaire à d'autres tableurs, comme Excel ou Google Sheets. Chaque modèle est une grille de cellules, et chaque cellule peut contenir un nom et une valeur. Des fonctions peuvent être utilisées pour relier les cellules entre elles afin de représenter des quantités plus complexes.
Par exemple, considérez la série de questions sur le paradoxe de Fermi. On peut utiliser l'équation de Drake (une estimation "au dos de l'enveloppe" pour déterminer s'il existe une vie intelligente dans la Voie lactée en dehors de nous, les humains) pour estimer le nombre de civilisations intelligentes dans notre galaxie en se basant sur 7 variables différentes (voir l'équation de Drake). Chaque estimation comporte ses propres incertitudes, et avec Guesstimate vous pouvez multiplier les estimations et leurs incertitudes ensemble pour obtenir une distribution de probabilité du nombre de civilisations intelligentes. Voir le modèle suivant par un utilisateur de Guesstimate sur cette probabilité. Consultez également les modèles publics.
N'oubliez pas de publier vos modèles dans les commentaires des questions pour que les autres puissent les voir !
Pour la modélisation théorique et l'analyse statistique de base. Les tableurs offrent des options similaires à Guesstimate, car vous pouvez créer des modèles théoriques pour décomposer les questions, produire des estimations pour les sous-questions, et exécuter des simulations de Monte Carlo de base (voir ici pour un exemple de ce type de simulation). Deuxièmement, l'analyse statistique de base (statistiques descriptives, corrélations, régressions, etc.) est pratique dans Excel (voir ici pour plus d'informations). Enfin, les tableurs créés sur Google Sheets peuvent également être partagés dans les commentaires, pour permettre aux autres de consulter votre travail.
Comme R, pour le calcul statistique avancé (modélisation linéaire et non linéaire, tests statistiques classiques, analyse de séries temporelles, classification, clustering) et les graphiques. Vous pouvez le télécharger ici gratuitement.
Comme le calculateur de distribution normale, le calculateur de distribution binomiale, et le calculateur de distribution de Poisson. Enfin, consultez ce calculateur de la règle de Bayes pour mettre à jour votre degré de croyance pour les questions oui/non en fonction de nouvelles informations.
Les logiciels de modélisation de systèmes peuvent générer et éclairer les prévisions de systèmes complexes. HASH peut être utilisé pour représenter des systèmes complexes et exécuter des scénarios "et si", afin d'affiner vos intuitions et d'améliorer vos prévisions.
Rejoignez la Social Science Prediction Platform, qui soutient la "collecte et l'évaluation systématiques des prévisions d'experts sur les effets de programmes sociaux non testés." Elle est conçue pour aider les décideurs politiques et les chercheurs en sciences sociales en améliorant la précision des prévisions, conduisant ainsi à une prise de décision plus efficace et à des améliorations de la conception et de l'analyse expérimentales.
Jouez à Calibrate Your Judgment, un tutoriel interactif de calibration produit par le projet OpenPhilanthropy. C'est peut-être la formation de calibration gratuite en ligne la plus utile actuellement disponible. Notez que vous devez vous connecter avec un compte GuidedTrack, Facebook ou Google, afin que l'application puisse suivre vos performances au fil du temps.
Le document d'AI Impact Evidence on good forecasting practices from the Good Judgment Project résume les conclusions du Good Judgment Project, l'équipe gagnante du tournoi de prévision de l'IARPA (2011-2015). L'article décrit les différents corrélats d'une prévision réussie ainsi que les heuristiques, les méthodologies de prévision, les perspectives philosophiques et les styles de pensée associés à de meilleures prévisions. De plus, il comprend une "recette" utile pour faire des prévisions qui décrit comment les superprévisionnistes (les 0,2 % meilleurs prévisionnistes) procèdent pour élaborer leurs prévisions.
Forecasting: Principles and Practice offre une introduction complète aux méthodes de prévision et présente suffisamment d'informations sur chaque méthode pour que les lecteurs puissent les utiliser de manière judicieuse. Le livre est facile à lire, concis et ne nécessite que des connaissances de base en statistiques.
Le livre présente les concepts clés de la prévision. De la prévision par jugement (qui peut être utile lorsque vous avez peu ou pas de données) à la régression simple/multiple, la décomposition de séries temporelles, le lissage exponentiel (ETS), et quelques sujets plus avancés comme les réseaux de neurones (le tout en R). Le livre est optimisé pour fournir des conseils pratiques sur la réalisation de prévisions, et ne cherche pas à donner une discussion approfondie des détails théoriques derrière chaque méthode.
Open Textbooks on Forecasting and Related Courses by Francis Diebold, et en particulier son cours Time-Series Econometrics: Forecasting, qui offre une introduction de niveau licence avancée / master à la prévision, définie au sens large pour inclure tous les aspects de la modélisation prédictive, en économie et dans les domaines connexes. Ayant utilisé ce livre pour mon cours de macroéconométrie, je recommande vivement cet ouvrage, notamment pour la modélisation des processus autorégressifs permettant de réaliser des prévisions ponctuelles et de densité (particulièrement utiles pour les prévisions d'intervalles numériques sur Pregauss).
Les sujets abordés comprennent : la régression d'un point de vue prédictif ; les espérances conditionnelles vs les projections linéaires ; l'environnement de décision et la fonction de perte ; l'objet de prévision, l'énoncé, l'horizon et l'ensemble d'informations ; le principe de parcimonie, les relations entre prévisions ponctuelles, par intervalles et de densité, et bien plus encore. Le livre est disponible ici, et les diapositives du cours couvrant le contenu du livre sont disponibles ici. Les ressources de Diebold sont sous licence Creative Commons.
Voici une petite sélection de la vaste littérature de recherche sur la prévision.
L'excès de confiance est un constat récurrent dans la littérature de recherche sur la prévision, et a été observé dans une analyse de 2016 des prévisions Pregauss. L'excès de confiance se manifeste sous de nombreuses formes, comme la confiance excessive dans les jugements intuitifs, les modèles explicites, ou l'expertise spécifique à un domaine (la vôtre ou celle d'autrui).
En général, l'excès de confiance amène les gens à :
Pour contrecarrer l'excès de confiance, les prévisionnistes devraient suivre cinq principes :(1) Envisagez des alternatives, en particulier dans les situations nouvelles ou sans précédent pour lesquelles les données manquent ;(2) Listez les raisons pour lesquelles la prévision pourrait être erronée ;(3) En interaction de groupe, désignez un avocat du diable (ou jouez l'avocat du diable dans la section commentaires !) ;(4) Obtenez des retours sur vos prévisions (en les publiant dans les commentaires par exemple) ;(5) Traitez les retours que vous recevez comme des informations précieuses.
C'est la pensée à la Fermi. Enrico Fermi a conçu le premier réacteur atomique. Quand il ne faisait pas cela, il adorait s'attaquer à des questions complexes comme "Combien y a-t-il d'accordeurs de piano à Chicago ?" À première vue, cela semble très difficile. Fermi commençait par décomposer le problème en parties plus petites et les classait dans les catégories du connaissable et de l'inconnaissable. En travaillant sur un problème de cette manière, vous exposez ce que vous ne savez pas ou, comme le dit Tetlock (2016), vous "faites sortir l'ignorance au grand jour."
Un maître du temps Pregauss sait qu'il n'y a rien de véritablement nouveau sous le soleil. Ainsi, les meilleurs prévisionnistes effectuent souvent des recherches créatives de classes de comparaison, même pour des événements apparemment uniques, et posent la question : à quelle fréquence ce type de choses se produit-il dans ce type de situations ? Identifiez des classes de comparaison pour les événements, et laissez vos prévisions s'appuyer sur le taux de base d'occurrence dans cette classe d'événements. C'est souvent plus facile et plus efficace que de comprendre le fonctionnement de l'événement à partir des principes fondamentaux.
Bien qu'il soit souvent judicieux d'utiliser une approche systématique de 'pensée par modèle' qui emploie un raisonnement théorique ou statistique explicite, vous devriez généralement aussi utiliser une approche basée sur l'intuition pour prédire. Lorsque ces deux approches donnent des réponses différentes, réfléchissez bien pour déterminer si votre question est le type de question qui est mieux traité par des jugements intuitifs ou par une modélisation systématique, et combinez les deux réponses en conséquence pour éclairer votre prévision. Selon Kahneman, les jugements intuitifs sur un sujet sont susceptibles d'être précis uniquement lorsque les trois conditions suivantes sont réunies :
Il est facile de justifier ou de rationaliser ses échecs. Ne le faites pas. Assumez-les et évaluez votre bilan (tant en résolution qu'en calibration) et comparez-le au bilan de la communauté. Vous voulez comprendre où vous vous êtes trompé et trouver des moyens de vous améliorer. Et ne regardez pas seulement les échecs. Évaluez aussi les succès pour déterminer si vous avez utilisé des techniques fiables pour produire vos prévisions ou si vous avez simplement eu de la chance. Par exemple, si vous avez un log-score moyen supérieur à 0,2, cela pourrait être un signe d'excès de confiance ; dans ce cas, vous devriez suivre les conseils pour contrecarrer l'excès de confiance présentés ci-dessus.
Partager votre raisonnement théorique (comme la publication de votre modèle Guesstimate), votre raisonnement statistique, vos sources d'informations/données ou vos dépendances avec les autres est une bonne pratique, non seulement parce que vous fournissez un bien public précieux pour notre compréhension de l'avenir, mais aussi parce que d'autres peuvent compléter votre travail avec des perspectives supplémentaires.
| Data Service | Organization | Topics | Size | Ease of Use | Comments |
|---|---|---|---|---|---|
| Public Data Explorer | All topics | Very large Public Data Explorer aggregates public data from 113 dataset providers (such as international organizations, national statistical offices, non-governmental organizations, and research institutions) | Very large Public Data Explorer aggregates public data from 113 dataset providers (such as international organizations, national statistical offices, non-governmental organizations, and research institutions) | This is perhaps the best place to look for public data and forecasts provided from third-party data providers Highly recommended also is the International Futures Forecasting Data on long-term forecasting and global trend analysis available on the Public Data Explorer | |
| Our World in Data | The Oxford Martin Programme on Global Development at the University of Oxford | Global living conditions: Health, Food Provision, The Growth and Distribution of Incomes, Violence, Rights, Wars, Culture, Energy Use, Education, and Environmental Changes | Small Our World in Data aggregates some hundreds of datasets, all of which are organized well and given appropriate context | Very Easy There are excellent visualizations. Each topic the quality of the data is discussed and, by pointing the visitor to the sources, this website is also a database of databases. Covering all of these aspects in one resource makes it possible to understand how the observed long-run trends are interlinked | Highly recommended for big picture questions about the human condition |
| Data.gov | Various branches of the U.S. Government | Agriculture, Climate, Consumer, Education, Energy, Finance, Health, Manufacturing, Public Safety, Science and Research | Very Large Over 285,000 datasets from most federal departments, city governments, universities, NGOs, and the private sector. | Moderately difficult You need to enter good search queries to get a short list of relevant results. | You can really find data on almost anything. |
| The World Bank Open Data | The World Bank | Agriculture & Rural Development, Aid Effectiveness, Climate Change, Economy & Growth, Education, Energy & Mining, Environment, Financial Sector, Gender, Health, Infrastructure, Poverty, Science & Technology, Social Development, Trade, Urban Development | Large 17,445 Datasets available. | Easy | Their datasets on Science & Technology might be especially relevant for Metaculus questions. |
| UNData | United Nations Statistics Division | Agriculture, Crime, Education, Employment, Energy, Environment, Health, HIV/AIDS, Human Development, Industry, Information and Communication Technology, National Accounts, Population, Refugees, Tourism, Trade, as well as the Millennium Development Goals indicators | Large | Very Easy | Very intuitive interface for dataset searching. |
| Global Health Observatory Data Repository | The World Health Organization | Health-related topics | Moderately large 1000 indicators for its 194 member states. | Easy You can browse this data by theme, category, or indicator. | Excellent for health-related questions, such as those involving pandemics, antimicrobial resistance, and malaria. |
| OECD Stat | Organisation for Economic Co-operation and Development (OECD) | Technology and Patents, Development, Environment, Globalisation, Finance, Health, Industry, Information and Communication Technology, Productivity, Social Protection and Wellbeing, Transport, and more | Very easy Their online statistical database permits Google-like keyword search. |
| Data Service | Organization | Topics | Size | Ease of Use | Comments |
|---|---|---|---|---|---|
| Bureau of Economic Analysis | U.S. Department of Commerce | Official macroeconomic and industry statistics, most notably reports about the gross domestic product (GDP) of the United States, as well as personal income, corporate profits and government spending | Large | Easy | |
| Yahoo Finance | Yahoo | Financial news, data and commentary including stock quotes, press releases, financial reports | Very Large | Very Easy | Here's the S&P 500 |
| Economic Research at the St. Louis Fed | St. Louis Fed | Money & Banking, Population, Employment, Production, Prices, International Data, Academic data (including the NBER Macrohistory database) | Very Large 509,000 US and international time series from 87 sources. | Very Easy Check out their categories for a breakdown of their datasets. |