FDMS – Challenge Tennis

Voici les informations pour le challenge de prédiction des matches de Tennis de l’UE FDMS

Accès aux données

La base de données est accessible à travers mySQL. Les informations d’accès aux données sont fournies sur Piazza (pour des raisons de sécurité)

Notés que, depuis phpmyadmin, vous pouvez exporter les tables en fichiers CSV

Structure de la base de données

La base de données est structurées en plusieurs tables décrites ici

games_atp

C’est la base d’entrainement. Chaque ligne correspond à un match.

  • ID1_G : L’identifiant du joueur qui a gagné le match
  • ID2_G : L’identifiant du joueur qui a perdu le match
  • ID_T_G : L’identifiant du tournoi (voir tours_atp)
  • ID_R_G : L’identfiant du round dans le tournoi (voir rounds)
  • RESULT_G ; Le résultat du match
  • DATE_G:  La date du match

games_atp_public

C’est la table des matches pour lesquels vous devez prédire le résultat. Les résultats du leaderboard seront calculés sur une partie de ces matches. A la fin du challenge, les résultats sur l’ensemble des matches seront publiés.

facts_atp

  • ID1 : L’identifiant du joueur qui a gagné le match
  • ID2 : L’identifiant du joueur qui a perdu le match
  • ID_T : L’identifiant du tournoi (voir tours_atp)
  • ID_R : L’identfiant du extit{round} dans le tournoi (voir rounds)
  • FS_1 : Nombre de premiers services réussis (joueur 1)
  • FS_OF1 : Nombre de premiers services (joueur 1)
  • ACES_1 : Aces (joueur 1)
  • DF_1 : Double Fautes (joueur 1)
  • UE_1 : textit{Unforced errors} (erreurs directes ?)
  • W1S_1: Nombre de points gagnés sur premier service
  • W1SOF_1: Nombre de points joués sur premier service
  • W2S_1: Nombre de points gagnés sur second service
  • W2SOF_1: Nombre de points joués sur second service
  • WIS_1 : Nombre de points gagnés en tout
  • BP_1 : Nombre de balles de break gagnées
  • BPOF_1 : Nombre de balles de break obtenues
  • RPW_1 : Nombre de points gagnés
  • RPW_OF1 : Nombre de points jouées
  • .._2 : Les mêmes pour le joueur 2

 players_atp

La mapping entre les identifiants et les noms des joueurs. Contient aussi quelques informations additionnelles.

ratings_atp

Contient le classement et le nombre de points ATP des jours à différentes dates

rounds

Permet de matcher un identifiant de round à un type de round

courts

Permet d’associer une type court à sa surface réelle

tours_atp

Description des différents tournois. NB: la date du tournoi peut être utilisée comme date de match si un matche n’est pas associè à une date

 Soumission sur le leaderboard

Le site du leaderboard se trouve à l’adresse suivante: (voir PIAZZA)

Le fichier de soumission est CSV (valeurs séparées par des ‘,’) de 5 colonnes:

  • ID Joueur 1
  • ID Joueur 2
  • ID Tournoi
  • ID Round
  • Résultat prédit (1 si joueur gagne, 2 si joueur 2)

Pour soumettre un fichier sur le site, voici la commande:

curl –form file=@fichier.csv  –form « team_name=xxxx » –form « description=xxxx » http://xxx/submit
Si tout se passe bien, il devrait apparaitre ensuite sur le leaderboard.