Un modèle d'IA atteindra-t-il un score supérieur à 90 % sur le GPQA Diamond avant fin 2026 ?