La base des statistiques

la base des statistiques

Comprendre une structure comme le turf et établir des statistiques appropriés n’est pas si facile, la preuve…

Il existe 3 types d’informations :

  1. le pourcentage
  2. sa relativité
  3. son évolution

Exemple : sur 2000 courses quinté, le favori est arrivé « placé » 1120 fois.

Le POURCENTAGE de réussite est donc de 56 %

Mais dans ces 2000 courses, 700 étaient du trot, dont 500 à Vincennes, dont 200 avec moins de 14 partants dans lesquelles le favori est arrivé 180 fois.

Soit une réussite de 90 % (180/200)

Si l’on retire ces courses du premier calcul, nous obtenons :

1800 courses et 940 victoires, soit une réussite de 52 % (au lieu de 56 %)

Le pourcentage est donc RELATIF à des conditions.

Maintenant, imaginons que dans les 10 dernières courses à Vincennes, de moins de 14 partants, le favori ne soit arrivé q’une fois.

Nous obtenons une EVOLUTION du pourcentage, qui passe de 90 % à 10 %

Voyons donc comment effectuer les analyses…

Le pourcentage est facile à calculer.

La relativité l’est beaucoup moins. En effet, plus vous augmenter l’échantillon, plus le résultat est juste, mais moins il est relatif à la situation.

Par exemple, sur les 2000 prochaines courses quinté, vous pouvez être pratiquement sûr que le favori arrivera 56 fois sur 100. C’est une information fiable, mais qui ne rapporte rien.

Sur les 200 courses de Vincennes, l’information peut rapporter gros, mais vous n’êtes sûr de rien. Il peut arriver entre 10 et 90 fois sur 100.

La question qui se pose est donc : comment conserver un pourcentage fiable en affinant la relativité.

Voyons tout d’abord quelles sont les principaux éléments de relativité :

  • le type de course (trot, plat, obstacles)
  • le nombre de partants

A cela, on peut évidemment ajouter d’autres éléments comme l’hippodrome, le temps ou les critères de la course, mais chaque élément divise d’autant la quantité de courses référentielles. Et nous n’avons déjà pas suffisamment de références.

3 types de course X 9 quantités de partants (12 à 20) = 27

4000 courses quinté / 27 = 150 échantillons (ce qui est déjà trop peu pour un résultat fiable).

Dans le domaine des statistiques, un échantillon (valable) est rarement inférieur à 1000. Dans le domaine du turf, je me contente bien souvent de 100 :)

Et pour combler le tout, il faut encore suivre l’évolution !

Comment analyser l’évolution d’une réussite avec seulement 150 références ?

Le plus simple est la méthode 10/100. On compare les 10 derniers résultats avec les 100 derniers.

Si l’on dispose d’un grand nombre de données, avec des éléments linéaires, on compare 5 à 10 % des derniers résultats par rapport à l’ensemble.

Mais cela varie en fonction des données. En effet, pour évaluer la réussite sur un hippodrome, il faut savoir si des modifications sont intervenues récemment (tracé, sol…). Pour un cheval, il faut savoir s’il a couru régulièrement ou s’il a eu une longue période d’absence.

Il faut également connaître les aléas (situations exceptionnelles) afin de supprimer ces mauvaises informations des calculs.





Tags: , , , , , , , , , , , , , , , , , , ,

Poster un commentaire


  1. Philippe

    Raisonnement extrêmement pertinent.
    Bravo, il y a un sacré boulot derrière à effectuer.


  2. Arwenn

    Bonjour, je vais peut-être dire des âneries…
    Je suppose que les pronostiqueurs professionnels font déjà tout cela, alors les résultats de tout ces calculs ne sont t’ils pas présent dans le cheval ayant le meilleur résultat de toutes les synthèses du jour, ou du moins de la réunion. Je ne sait pas si je suis très clair.


  3. Bazzie

    Bonjour,
    Je n’ai pas vu dans vos articles ce que vous pensiez des écarts.
    Qu’en pensez-vous ?


  4. bouchahta

    analyse rationelle, bravo
    puis-je avoir votre aide ?
    j’ai perdu beaucoup d’argent
    merci

comment-je-gagne-au-PMU