Soutěž EMC zkoumala, co dělá motocyklového krále neporazitelným. Její výherci na to přišli.

Soutěž datových vědců ukázala cestu, jak by se mělo na projektech Big Data pracovat. A že je opravdu možné a potřebné je srozumitelně lidem ukázat, vizualizovat a prezentovat takovým způsobem, aby byly srozumitelné každému. V soutěži uspěly dva návrhy: projekt Stefana Jola v kategorii modelování a projekt Charlotte Wickhamové v kategorii vizualizace. Průjezd náročným okruhem můžeme najednou vidět v jiném světle. „Věděl jsem, že jsem rychlý, ale až dosud jsem netušil proč,“ poznamenal k tomu John McGuinness.

morecamble 1

Nedávno jsme publikovali článekCo dělá motocyklového krále neporazitelným“. V něm jsme se věnovali našemu datovému výzkumu ve spolupráci se samotným McGuinnessem. Chtěli jsme zjistit, proč je nejlepší v závodu Isle of Man TT, o čemž svědčí jeho 28 trofejí jen z tohoto závodu. Na začátku našeho bádaní jsme měli plno otázek. Má lepší tělo nebo snad lépe ovládá svůj motocykl? Má agresivnější jízdu? Či snad má lepší povědomí o trase? Byla to snad nějaká kombinace těchto faktorů?

morecamble 2

A proto jsme vyhlásili soutěž CrowdANALYTIX, kde jsme vyzvali kvalifikované akademiky a odborníky z různých prostředí a odvětví, aby za pomoci námi poskytnutých dat odpověděli na otázku: Proč je John McGuinness nejrychlejší? Soutěž měla dvě samostatné kategorie. Jedna byla zaměřená na statistické modelování a druhá na vizualizaci dat. Soutěžící tak měli možnost využít stejné nástroje, které používají datoví vědci z EMC každý den, aby vyřešili složité obchodní problémy a zajistili přístupnou, intuitivní a podrobnou analýzu.

Data o jezdci i motorce

McGuinness

Motocykl legendárního jezdce byl osazen množstvím senzorů, ty v každém okamžiku zaznamenaly všechny potřebné údaje o jízdě, konkrétní polohu na trati, rychlost, zařazený rychlostí stupeň, náklon, způsob průjezdu zatáčkou a podobně. Další senzory předávaly informace o samotném jezdci, jeho tep, krevní tlak, dechovou frekvenci, náklon, ale také přetížení. Obrovské množství dat, které senzory vyprodukovaly, umožnilo skutečně velmi přesně virtualizovat McGuinnessovu jízdu. A především ji analyzovat. Přesně to se stalo výzvou pro datové vědce a nejen pro ně.

morecamble 3

Soutěže se zúčastnilo více jak 750 snaživců z celého světa. Avšak výsledný návrh nakonec podalo pouhých 28 lidí vzhledem k obtížnosti úkolu a objemu dat. Aby toho nebylo málo, vědci měli k dispozici i podobná data od Chada, zkušeného jezdce, který projel stejnou trať za podobných podmínek. A už běžné srovnání odhaluje rozdíly. Například rychlost se u obou lišila jen minimálně, náklon či otáčky také. Přesto byl John McGuinness v cíli o 5 sekund dříve. Ale co je zajímavé, jeho tepová frekvence zůstávala přibližně o třetinu nižší.

morecamble 5

Podobných rozdílů si všiml Stefan Jol, PhD., analytik tržeb v jednom britském rádiu, který využil metodu náhodného lesa (forest modeling), která ukázala, že mnohem více než na technických parametrech záleží na jezdci samotném, na poloze jeho těla i motocyklu. Analýza dat ukázala, že správná volba jízdního stylu v jedné části, dokáže výrazně ovlivnit výkon ve druhé části. Tímto řešením zaujal porotu a získal první místo v kategorii modelování.

Profesorka statistiky na státní univerzitě v Oregonu Charlotte Wickhamová, PhD., oslovila porotu tím, že dokázala data ze senzorů nejen vizualizovat, ale zároveň je zpřístupnit v takovém formátu, že kdokoli z dalších zájemců s nimi může nadále pracovat a analyzovat údaje sektor po sektoru. Vytvořila totiž aplikaci ve statistickém programovacím jazyce R umožňující jednoduché a přehledné srovnání dat John McGuinnesse a Chada.

morecamble 4

 

Vítězům gratulujeme a vy se můžete na oba podívat zde, včetně přehledné vizualizace.

Napsat komentář

Vaše emailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *