Comment savoir si vos stats sont fiables ?

… et permettent de définir de bonnes probabilités ?

Le concept est assez simple : plus vos éléments sont nombreux, semblables, stables et récents, meilleures sont vos sources.

Par exemple, vous aurez de meilleurs résultats en intégrant uniquement les courses de trot à votre série (le plat dans une autre série, les obstacles dans une troisième), plutôt qu’en mélangeant tout.

Le problème, encore une fois, étant le nombre de données dans la série.

Plus vous sélectionnez des critères précis, plus votre série est fiable. Mais moins vous avez de données dans la série, et moins vos statistiques sont fiables.

Dans notre exemple, si vous avez une base de 1000 courses, avec seulement 200 courses d’obstacles, et que vous séparez encore entre ces courses d’obstacles en moins et plus de 12 chevaux, chaque série ne comportera que 100 courses. C’est trop peu pour des données fiables.

Comment utiliser cela concrètement ?

Il faut déterminer les éléments vraiment différents.

Par exemple, il est impératif de séparer par types de courses, mais pas par nombre de partants. En effet, il suffit d’adapter ce qui peut l’être au lieu de créer une autre série.

Par exemple, il suffit de moduler les calculs en fonction du nombre de partants.

Des caractéristiques différentes, comme le type de départ, donnent des résultats complètement différents. Par contre, le nombre de partants donne des résultats proportionnels.

Et comment déterminer la fiabilité de vos sources ?

Le plus facile est d’analyser les dépassements d’écart.

Il existe des calculs très complexes, mais voici une méthode assez simple.

Vous commencez par faire une suite chronologique de chiffres représentant les résultats : 0 pour les arrivées négatives et 1 pour les gagnantes.

Ensuite vous comptez le nombre total de chiffres, puis le nombre de 1 et le nombre de 01. De nombreuses fonctions permettent cela dans les logiciels. j’utilise Occurrences ( Texte ; ChaîneRecherchée ) dans Filemaker.

S’il y a plus de 1 que de 0, divisez le nombre de 01 par le nombre de 0 et multipliez par 100.

Sinon, divisez le nombre de 01 par le nombre de 1 et multipliez par 100.

Cela donne un pourcentage de fiabilité. 100 % étant l’idéal.

Attention, cela reste une estimation. Vous pouvez l’affiner en recherchant le nombre de suites correspondant à la situation.

Par exemple, si vous avez 300 x 1 pour 600 x 0, les suites normales seraient : 001001001…

Il suffit donc de compter le nombre de 00 par rapport au total maximum que vous pouvez avoir (300 dans l’exemple).

Il est évident que si vous avez seulement 100 x 00 sur 300, il faut vous inquiéter.

Une autre méthode consiste à comparer les résultats sur plusieurs périodes.

Par exemple, vous divisez votre base en 3 et vous comparez les résultats.

Si vous obtenez des rendements comme 30 %, 60 % et 45 %, il faut vous inquiéter.

L’idéal serait d’avoir 45 %, 45 %, 45 % !

Un commentaire

  1. bonjour
    très très intéressant comme approche ,je n’ai pas encore vérifié vos calculs et faut-il encore que je m’imprègne de ce qui est déjà écrit et comparer avec ce que je mets en place et que je commence à utilisé
    en tous cas merci pour la qualité de l’article et de son utilité.
    daniel

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *