Kaggle sdružuje největší komunitu datových specialistů na světě – v současnosti přes 100 000 lidí z více než 100 zemí a 200 univerzit. Kaggle založil v roce 2010 Anthony Goldbloom v Melbourne a v roce 2011 se firma přesunula do San Francisca a v témže roce získala investici ve výši 11 miliónů dolarů od skupiny investorů vedených Index Ventures a Khosla Ventures. Kaggle pořádá soutěže týkající se prediktivního modelování, které pomáhají řešit nejsložitější problémy v různých oblastech od zdravotnictví po finance a pojišťovnictví. Členové komunity pak soutěží o co nejlepší výsledky a mohou tak získat zajímavé odměny v řádech tisíců až stovek tisíc dolarů. Atraktivitu soutěží zvyšuje fakt, že účastníci okamžitě vidí svůj výsledek v porovnání s ostatními.
Firmy se nemusí bát o svá data – za pomocí odborníků z Kaggle je mohou anonymizovat, popřípadě si mohou vybrat soutěžící z řad prověřených specialistů, kteří mají podepsané NDA (non disclosure agreement). Pro složitější úlohy je možné si najmout nejúspěšnější členy komunity (0,5% z stotisícové členské základny) za hodinovou sazbu. Pro řadu datových specialistů to představuje i jejich hlavní příjem. Tuto crowdsourcingovou platformu už úspěšně použila řada nadnárodních firem – Microsoft díky tomu dokázal vylepšit rozpoznávaní gest na konzoli XBOX, NASA dosáhla lepšího zobrazování temné hmoty ve vesmíru. Zatím největší soutěž o 500 000 USD vypsala Heritage Provider Network - síť lékařských zařízení, která chtěla vytvořit model, který by předvídal počet dnů strávených v budoucím roce v nemocnici pro jednotlivé pacienty. To jí umožňuje lépe plánovat kapacity a šetřit tak milióny dolarů. V letošním roce stejná firma připravuje privátní soutěž (tedy jen pro osvědčené členy z nejlepšími výsledky z předchozí soutěže) o rovné 3 milióny USD.
Pro zkušené data specialisty se zde otvírá zajímavá možnost jak si přivydělat nebo se blýsknout před potencionálními zaměstnavateli. Na Kaggle se řeší i řada vědeckých problémů a součástí odměny bývá i placená účast na konferencích nebo možnost publikovat v renomovaných vědeckých časopisech. Pokud se najde více firem, které překonají blok z poskytování svých interních dat mimo firmu, přinese to do dataminingu velkou změnu a zvýšenou konkurenci současným specialistům. Kaggle je ukázkový příklad toho, jak internet mění zaběhlé zvyklosti – dneska už jsme si zvykli, že si můžeme za pár kliků nakoupit téměř libovolné zboží a brzy si bude možné objednávat tímto způsobem i služby. Příležitost pro vnímavé.
Díky @pavelcurda za inspiraci pro článek.