Statistiques sur le Marathon des Alpes Maritimes.

J’ai entrepris de faire quelques statistiques sur le Marathon des Alpes-Maritimes.

Les statistiques de base :

La première c’est le nombre de participants par catégorie :

Statistique 1

L’évolution en fonction des catégories :

Catégories Ecart 2008/2009 Ecart 2009/2010 Ecart 2010/2011 Ecart 2011/2012 Ecart 2013/2013
ESF

400%

120%

-59%

33%

-25%

ESM

80%

16%

-27%

21%

-33%

HCF

-100%

NA

-20%

-75%

-100%

HCH NA NA NA NA

-100%

HCM

-15%

-39%

114%

-87%

0%

JUF NA

-100%

NA

-100%

NA
JUM NA

-100%

NA NA NA
M NA

-100%

NA

-100%

NA
MIM NA NA

-100%

NA NA
SEF

35%

15%

-9%

-9%

2%

SEM

7%

-2%

-19%

-7%

-3%

V1F

-8%

8%

-4%

-9%

4%

V1M

-9%

7%

-12%

-9%

5%

V2F

-32%

29%

-17%

3%

8%

V2M

-14%

2%

-15%

2%

8%

V3F

-3%

-12%

-4%

-2%

23%

V3M

-11%

4%

-14%

-6%

17%

V4F

75%

-86%

500%

17%

0%

V4M

-17%

28%

-6%

33%

-18%

Total général

-5%

5%

-13%

-6%

3%

Pareil avec un petit graphique :

Statistique 13

La deuxième c’est la courbe des temps pour faire le marathon :

Statistique 2

Pareil, mais uniquement pour la catégorie SEM :

Statistique 8

Sachant que vous pouvez retrouver ceci en fonction des années sur l’article suivant.

Le temps moyen pour faire le marathon des Alpes-Maritimes:

Statistique 3

Le temps moyen par catégorie pour faire le marathon des Alpes-Maritimes:

Statistique 4

Maintenant plus compliqué … le nombre de personnes ayant mis plus de temps dans le second semi-marathon que dans le premier semi-marathon.

Statistique 5

En gros, 91% des personnes mettent plus de temps dans la seconde partie, ce qui me semble normal vu qu’il y a la fatigue et le mur des 30 km … enfin je parle pour moiBaffle

Maintenant le temps moyen entre le premier et le second semi-marathon pour les personnes qui mettent plus de temps au second … les 91% … les gens normaux Embarrassed :

Statistique 6

On va dire 10 min en moyenne, ce qui représente un premier semi de 1h55 et un second semi de 2h05 pour la personne moyenne (+8,6% … j’avais de chiffre de 8% en tête).

Pour les personnes qui mettent moins de temps :

Statistique 7

Les personnes au dessus de 20 min ont du tricher … Hit with Brick ils ont mis plus de 3 heures et moins de 1 heure pour faire le reste … cela sent l’opération covoiturage. J’ai les noms …Hell Boy

Statistique sur le nombre de participation, j’ai pris pour postulat que NOM+PRENOM c’était une clef unique … ce qui est faux mais en grande partie vrai.

J’obtiens donc ceci sur le nombre de participation :

Statistique 11

J’ai donc 62 personnes qui ont fait tous les marathons depuis la création.

Si je prends les personnes qui ont fait 5 marathons, est-ce qu’elles se sont améliorées avec le temps ?

Statistique 10

Le nombre :

Statistique 11

 

Maintenant prenons les personnes qui ont fait le marathon 2009 et le marathon 2010, combien de personne cela représente ? Environ 1400 …

Est-ce que ces personnes ont fait une meilleure performance au second marathon ?

Statistique 14

 

Quel est l’amélioration ou la régression par tranche de 4 min ?

Statistique 15

On va dire que cela se joue à +/- 10 min …

Petits sondages, merci :

[poll id= »9″] [poll id= »10″] [poll id= »11″]

Si vous avez d’autres demandes, je suis à votre écoute …

La mise en forme des données : (pour les programmeurs)

La premiere étage consiste à faire des wget sur le site afin de télécharger les pages html.

Ensuite il faut faire la mise en forme :

export LANG=C
export LC_CTYPE=C
grep 'input type="hidden"' MARATHON-NICE-20*/resultat* | awk -F\" '{print $6 }'  > liste_tous_marathon.txt
awk 'BEGIN {phrase = " ";} {if (NR % 20 == 0) { print $1 $2 $3 $4 $5 "\t" phrase; phrase = " ";} else { phrase =  $1 $2 $3 $4 $5 "\t" phrase}}' liste_tous_marathon.txt > liste_2.txt

Petit contrôle sur le nombre de ligne :

wc -l liste_2.txt
   44983 liste_2.txt

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Time limit is exhausted. Please reload CAPTCHA.