Le Champion is een van de grootste sportverenigingen van Nederland met jaarlijks 60 sportevenementen en 200.000 deelnemers. De organisatie beschikt over data, maar doet daar nu te weinig mee. Dit moet beter kunnen, bleek na een goed gesprek, samen met de andere initiatiefnemers van dit event. Tijdens het event bleek al snel dat de hardloopdata een hoop bruikbare informatie bevat en konden de deelnemers aan de Sport Data Challenge ook duidelijk laten zien. Zij kwamen met indrukwekkende ideeën om de evenementen en marketing van Le Champion te verbeteren.
Op 15 november vond de eerste Sport Data Challenge plaats. Dit evenement is een samenwerking van Amsterdam Data Science, Sport Data Valley, Amsterdam Institute of Sport Science en Running 20/20. Het doel van de Sport Data Challenge is om met behulp van teams van studenten te laten zien wat allemaal mogelijk is met sportdata, om zowel de breedte- als topsport vooruit te helpen.
De temperatuur stijgt in het zaaltje van Startup Village op het Amsterdam Science Park. Acht groepen van vier tot zes deelnemers zitten met hun laptops opengeklapt op tafel bestanden vol data uit te pluizen. De deur moet op een kier om frisse buitenlucht naar binnen te laten. Dat krijg je als er hard gewerkt wordt.
De studenten en data-professionals die vandaag aanwezig zijn doen mee aan de eerste Sport Data Challenge, een hackathon-achtig evenement om de mogelijkheden van sportdata te verkennen. Ze buigen zich over een dataset die is aangeleverd door Le Champion.
Voor de hackathon van start ging, schetste uitgever bij Hearst (o.a. Runner’s World, Men’s Health en Bicycling) Imo Muller eerst een korte achtergrond van hardlopen in Nederland. Hij nam zijn eigen data mee als opwarmertje: 2,1 miljoen hardlopers, tweeduizend evenementen per jaar en de tien kilometer en halve marathon als populairste afstand. Niet alle aanwezigen hebben iets met hardlopen, bleek al snel. Ongeveer de helft loopt regelmatig. Wel heeft iedereen ‘iets’ met data.
De data-fanatici kunnen hun hart ophalen. In de set van Le Champion zitten allerlei gegevens over de vier grootste hardloopevenementen, variërend van de weersomstandigheden, het parcours en de uitslagen. Daarnaast zijn er gegevens beschikbaar over de nieuwsbrief die naar de nieuwsbriefleden uitgaat. Vandaag is Le Champion de ‘klant’ voor wie de deelnemers relevante ideeën moeten opvissen uit de berg gegevens.
Kwaliteit van het evenement verbeteren
“We hebben veel data en doen daar te weinig mee”, zegt Oskar van Dijk, manager Marketing & Communicatie bij Le Champion. “Het is voor ons interessant om mee te doen aan de challenge. Momenteel weten we niet goed welke data relevant zijn en wat we ermee kunnen.” Als ‘klant’ gaf hij de hackathonners drie brede vragen mee waarover hij graag uitsluitsel zou krijgen. Wat is er nodig om binnen de twee uur de TCS Amsterdam Marathon te lopen? Is het mogelijk om prestaties of uitval te voorspellen? Wanneer kunnen we de evenementen het beste plannen vanuit marketingperspectief? Van Dijk: “We hebben het redelijk algemeen ingestoken dus het kan alle kanten uit.”
Tot nog toe doet Le Champion relatief eenvoudige dingen met data, zoals analyses maken van de eindtijden en profielen van de doelgroep. Daar houdt het wel een beetje op. Vandaag op de hackathon denkt Van Dijk vooral uit marketingperspectief. Hoe kan de organisatie meer mensen aantrekken? Maar ook: hoe krijgen deelnemers een leuke ervaring zodat ze zich blijven inschrijven? De kwaliteit van het evenement is minstens zo belangrijk en blijft een uitdaging. Zo heeft het parcours van de TCS Amsterdam Marathon een paar punten waarop veel mensen tegelijk lopen. Soms is het lang wachten in het startvak, dat soort dingen zijn vervelend. Van Dijk: “Het zou fantastisch zijn als we inzichtelijk krijgen hoe de inrichting van de evenementen te verbeteren is.”
Hardlopen is al ver met data
Hardlopen is de sport die het actiefst is met data. Lopers staan ervoor open, zijn zelf actief bezig hun eigen voetstappen te tracken. Ze beginnen met Runkeeper om de afstand en snelheid bij te houden en gaan steeds verder. De volgende stap is de aanschaf van hartslag- en vermogensmeters. Het is daarom passend om de eerste Sport Data Challenge te laten draaien om hardlopen, vindt Neal Beentjes van het Amsterdam Institute of Sport Science, mede-organisator van de hackathon. “Via het platform Sport Data Valley helpen we de topsport al met data. We willen het grotere publiek ook laten zien wat je met data kan doen.” Zo’n evenement als vandaag kan volgens hem bruikbare ideeën opleveren. Ik zie bij de teams nu al oplossingen die leven en waar we verder mee kunnen.”
De deelnemers hebben vijf uur de tijd om met iets bruikbaars op de proppen te komen. Ondertussen lopen data-wetenschappers rond in de zaal om de groepen waar het nodig is te ondersteunen. Het ene team werkt aan patronen tussen de weersomstandigheden en wervingsmailings voor de hardloopevenementen. Schrijven mensen zich in als de mail op een zonnige dag komt? Een ander kijkt naar de uitval van mensen tussen aanmelding en deelname. Waaraan ligt dat? Een derde groep zit meer op de voorspelling van individuele eindtijden op basis van eerdere resultaten.
Het valt op: de teams zijn allemaal enorm gefocust. Af en toe staat er iemand op om wat te drinken te pakken, maar verder laten hun ogen het scherm niet los. De helft van de inschrijvers is student, de andere helft data scientist of IT-professional, weet Jeanne Kroeger van Amsterdam Data Science. “Mensen doen niet mee voor de prijs”, zegt ze. “Ze vinden het gewoon gaaf om data in te zien die nog niet openbaar is.”
Meer doen met voorspellingen
Online specialist bij Le Champion Joyce Spruit is verantwoordelijk voor onder andere de nieuwsbrief; zij hoopt op slimme oplossingen op dat gebied. “Niet alle grote hardloopevenementen zitten altijd vol. We willen meer data gaan verzamelen rond de werving van deelnemers. Op welk moment voor de race komen ze binnen op de website en op welk moment haken ze af?”
“We willen ook meer met voorspellingen gaan doen”, vult IT’er Nigel van Houten aan, die via het extern bedrijf Intellegus voor Le Champion werkt. “Neem bijvoorbeeld de uitval tijdens een race. Het zou mooi zijn als we de factoren die daarmee samenhangen bij elkaar op kunnen tellen om te voorspellen wie de finish niet haalt. Die groep kunnen we dan op een andere manier benaderen dan de groep lopers die goed getraind is. De niet-finishers krijgen bijvoorbeeld andere informatie in de nieuwsbrief om zich voor te bereiden, zoals ‘kleed je niet te warm.’”
Het liefst zou hij op dit moment zelf ook in de data wroeten. Vanwege de strikte privacywetgeving was het overigens niet mogelijk om de teams de volledige dataset te geven, geeft hij aan. Er zit nog wel wat data onder. “De uitkomsten moeten misschien gecorrigeerd worden aan de hand van de werkelijke set, dat is even afwachten.”
De digitale klok die op de muur geprojecteerd staat geeft aan dat de tijd om is. Iedereen laptops dicht, de challenge zit erop. De hackathonners beginnen voor het eerst vandaag in beweging te komen. Biertjes komen uit de koelkast en pizzadozen gaan open, de gesprekken gaan maar over één ding: de hardloopdata.
Mooie leeromgeving
Een kwartier nadat de teams in twee minuten hun idee pitchte komt de jury – met een stuk pizza in de hand – tot een oordeel. “Teams en projecten werden snel gevormd, iedereen werkte efficiënt samen. Veel bedrijven zullen jaloers zijn op deze mate van toewijding”, grapt jurylid en sportdatawetenschapper Rens Meerhoff van de Universiteit Leiden. Hij roemt de teams om de hoge kwaliteit van hun oplossingen die soms al gedetailleerd zijn uitgewerkt. Er is een idee om de TCS Amsterdam Marathon de snelste marathon ter wereld te maken, om de ervaring na een race te verbeteren door middel van een customized dashboard en om mensen aan het lopen te krijgen door de nieuwsbrieven ‘s ochtends op regenachtige dagen te versturen.
Het winnende team deed er een schepje bovenop, zij maakte een visualisatie van de drukte op bepaalde tijden op het parcours van de TCS Amsterdam Marathon. De vraag die de deelnemers aansneden: hoe kunnen we file op het parcours in beeld brengen en voorspellen? Op de animatie is duidelijk te zien wanneer de drukte mogelijk een probleem wordt voor de veiligheid en de beleving. Het team adviseert de starttijden beter te plannen om opstoppingen te voorkomen. En dat idee levert elk lid een volledige TCS Amsterdam Marathon Mizuno-hardloopoutfit op.
De stemming onder de betrokken partijen is opgetogen. “We wilden niet iets organiseren voor het organiseren”, zegt Marcel van der Kuil, bestuurslid van Running 20/20. “Er moest echt iets bruikbaars uitkomen. Met alle ideeën kan je wel wat.”
Oskar van Dijk van Le Champion is ook blij verrast. “Ik had in eerste instantie geen hoge verwachtingen, omdat ik simpelweg niet wist wat een hackathon inhield. Nu heb ik er een beter idee van. De informatie die je uit de dataset kan halen is zo veelzijdig. Dit evenement is door de dynamiek, diversiteit aan kennis en samenstelling van specialismen een mooie leeromgeving. Wij als organisatie leren er veel van en krijgen er veel voor terug.” Stilletjes is de verwachting dat deze challenge de eerste van meerdere edities is. Volgend jaar weer? Van Dijk: “Ja, doe nog maar een keer hoor!” Zo denken alle partijen erover. De Sport Data Challenge zou weleens een blijvertje kunnen worden.
Wat vonden de deelnemers ervan?
Suzanne Bardelmeijer (24) – student artificial intelligence aan de VU
“Dit is mijn eerste hackathon. Ik ben zelf geen hardloper, maar doe aan tennis en heb gedanst. De combinatie van ‘sport en computers’ trok me wel aan. De hackathon is eigenlijk precies wat ik ervan had verwacht: snel beslissingen maken. En minder vrouwen dan mannen. Ik denk dat we echt iets kunnen vinden wat de klant meteen morgen kan gebruiken. Misschien dat ik volgend jaar weer kom, het zou leuk zijn als er dan een ander onderwerp is.”
Ildiko Lacz (50) – centraal functioneel beheerder bij de HvA
“Er zijn vandaag veel studenten, zoals verwacht. Naast mijn baan doe ik nog een master met een specialisatie in data science. Hardlopen doe ik niet, maar andere mensen uit onze groep wel. De challenge is best lastig, we hebben weinig tijd om alles goed uit te zoeken en de betekenis van sommige data is beknopt. Gelukkig kwamen we in het begin snel overeen wat we wilden. Ik zou volgend jaar zeker weer mee doen; ik hou van uitdagingen.”
Xabi Ezechiel (29) – data scientist bij een financieel bedrijf
“Ik heb meegedaan aan competities die lijken op die van vandaag, maar dit is m’n eerste echte hackathon. Het leuke van vandaag is dat er ruimte is voor creativiteit, we kunnen zelf bepalen wat we met de data gaan doen. De eerdere competities die ik deed verliepen veel gestructureerder. Ik doe niet mee vanwege de prijs, we wisten niet eens dat er een prijs was. Het is gewoon een relaxte dag. Of ik zelf loop? Ja, drie keer per week. Of nou ja, in realiteit één keer, soms twee.”